SlideShare a Scribd company logo
1 of 44
Организация ЭВМ и систем
Тема: RISC – процессоры
• Переход от CISC к чертам RISC архитектуры в
семействе IA-32
• Основные черты RISC – процессоров
• Характеристика современных RISC – процессоров,
основные направления развития
Экскурс в историюЭкскурс в историю
В 70-е годы 19 века ученые выдвинули революционнуюВ 70-е годы 19 века ученые выдвинули революционную
по тем временам идею создания микропроцессора,по тем временам идею создания микропроцессора,
"понимающего" только минимально возможное количество"понимающего" только минимально возможное количество
команд.команд.
ЗамыселЗамысел RISCRISC - процессора (Reduced Instruction Set- процессора (Reduced Instruction Set
Computer,Computer, компьютер с сокращенным набором командкомпьютер с сокращенным набором команд))
родился в результате практических исследований частотыродился в результате практических исследований частоты
использования команд программистами, проведенных виспользования команд программистами, проведенных в
70-х годах в США и Англии. Их непосредственный итог -70-х годах в США и Англии. Их непосредственный итог -
известноеизвестное ""правило 80/20правило 80/20": в 80% кода типичной": в 80% кода типичной
прикладной программы используется лишь 20%прикладной программы используется лишь 20%
простейших машинных команд из всего доступногопростейших машинных команд из всего доступного
набора.набора.
Определение RISC-процессора
В действительности,В действительности, исходно аббревиатура RISCисходно аббревиатура RISC
расшифровываласьрасшифровывалась несколько иначе, а именно какнесколько иначе, а именно как
Rational Instruction Set Computer (RISC, компьютер сRational Instruction Set Computer (RISC, компьютер с
рациональной системой командрациональной системой команд).).
RISC-процессоры, таким образом противопоставлялисьRISC-процессоры, таким образом противопоставлялись
процессорам с необязательно сложной (CISC - Complexпроцессорам с необязательно сложной (CISC - Complex
Instruction Set Computer, компьютер со сложной системойInstruction Set Computer, компьютер со сложной системой
команд), но "иррациональной", исторически сложившейсякоманд), но "иррациональной", исторически сложившейся
архитектурой, в которой, в силу требований бинарной иархитектурой, в которой, в силу требований бинарной и
ассемблерной совместимости с предыдущимиассемблерной совместимости с предыдущими
поколениями, накоплено множество команд,поколениями, накоплено множество команд,
специализированных регистров и концепций, в общем-то испециализированных регистров и концепций, в общем-то и
не нужных, но вдруг отменишь команду двоично-не нужных, но вдруг отменишь команду двоично-
десятичной коррекции, а какое-то распространенноедесятичной коррекции, а какое-то распространенное
приложение "сломается"?приложение "сломается"?
Первый "настоящий"Первый "настоящий" RISC-процессор с 31 командойRISC-процессор с 31 командой
был создан под руководством Дэвида Паттерсона избыл создан под руководством Дэвида Паттерсона из
Университета Беркли, затем последовалУниверситета Беркли, затем последовал процессорпроцессор сс
наборомнабором изиз 39 команд39 команд. Они включали в себя 20 - 50 тыс.. Они включали в себя 20 - 50 тыс.
транзисторов. Плодами трудов Паттерсонатранзисторов. Плодами трудов Паттерсона
воспользовалась компания Sun Microsystems,воспользовалась компания Sun Microsystems,
разработавшая архитектуру SPARC с 75 командами вразработавшая архитектуру SPARC с 75 командами в
конце 70-х годов.конце 70-х годов. В 1981 г. в СтанфордскомВ 1981 г. в Станфордском
университете стартовал проект MIPS по выпуску RISC-университете стартовал проект MIPS по выпуску RISC-
процессора с 39 командами.процессора с 39 командами. В итоге была основанаВ итоге была основана
корпорация Mips Computer в середине 80-х годов икорпорация Mips Computer в середине 80-х годов и
сконструирован следующий процессор уже с 74сконструирован следующий процессор уже с 74
командами.командами.
Примерно в то же время Intel разработала сериюПримерно в то же время Intel разработала серию
8038680386, последних "истинных" CISC-процессоров в, последних "истинных" CISC-процессоров в
семействе х86.семействе х86. В последний раз повышениеВ последний раз повышение
производительности было достигнуто только за счетпроизводительности было достигнуто только за счет
усложнения архитектуры процессораусложнения архитектуры процессора: из 16-разрядной: из 16-разрядной
она превратилась в 32-разрядную, дополнительныеона превратилась в 32-разрядную, дополнительные
аппаратные компоненты поддерживали виртуальнуюаппаратные компоненты поддерживали виртуальную
память и добавился целый ряд новых команд.память и добавился целый ряд новых команд.
Основные особенности RISC -Основные особенности RISC -
процессоровпроцессоров
1.1.Сокращенный набор командСокращенный набор команд (от 80 -150 команд).(от 80 -150 команд).
2.2.Большинство команд выполняется за 1 такт.Большинство команд выполняется за 1 такт.
3.3.Большое количество регистров общегоБольшое количество регистров общего
назначения.назначения.
4.4.Наличие жестких многоступенчатых конвейеров.Наличие жестких многоступенчатых конвейеров.
5.5.Все команды имеют простой формат иВсе команды имеют простой формат и
используются немногие способы адресации.используются немногие способы адресации.
6.6.Наличие вместительной раздельной кэш памяти.Наличие вместительной раздельной кэш памяти.
7.7.ПрименениеПрименение оптимизирующих компиляторовоптимизирующих компиляторов,,
которые анализируют исходный код и частично меняюткоторые анализируют исходный код и частично меняют
порядок следования команд.порядок следования команд.
RISC – процессоры 3-го поколенияRISC – процессоры 3-го поколения
1.1.Ultra SPARC (ф. Sun Microsystem).Ultra SPARC (ф. Sun Microsystem).
2.2.PowerPC 620 (ф. IBM/Motorola).PowerPC 620 (ф. IBM/Motorola).
3.3.Alpha 21164 (ф. DEC).Alpha 21164 (ф. DEC).
4.4.R 10000 (ф. Mips Technology).R 10000 (ф. Mips Technology).
5.5.PA-8000 (ф. Hewlett Packard).PA-8000 (ф. Hewlett Packard).
Самыми крупными разработчиками RISCСамыми крупными разработчиками RISC
процессоров считаютсяпроцессоров считаются Sun MicrosystemsSun Microsystems (архитектура(архитектура
SPARC),SPARC), IBMIBM (многокристальные процессоры Power,(многокристальные процессоры Power,
однокристальные PowerPC), Digital Equipment (Alpha),однокристальные PowerPC), Digital Equipment (Alpha),
Mips TechnologiesMips Technologies (семейство Rxx00), а также(семейство Rxx00), а также Hewlett-Hewlett-
PackardPackard (архитектура PA-RISC).(архитектура PA-RISC).
По данным независимой компании IDC за 1992 годПо данным независимой компании IDC за 1992 год
архитектура SPARC занимала 56 % рынка, далееархитектура SPARC занимала 56 % рынка, далее
следовали MIPS – 15 % и PA-RISC – 12.2 %.следовали MIPS – 15 % и PA-RISC – 12.2 %.
Основные черты RISC –Основные черты RISC –
процессоров 3-го поколенияпроцессоров 3-го поколения
•ВсеВсе ЦП являются 64-х разрядными иЦП являются 64-х разрядными и
суперскалярнымисуперскалярными (запускаются не менее 4-х команд за(запускаются не менее 4-х команд за
такт).такт).
•Встроенные конвейерные блоки арифметики сВстроенные конвейерные блоки арифметики с
плавающей точкой.плавающей точкой.
•Многоуровневая кэш память.Многоуровневая кэш память. Большинство RISCБольшинство RISC
процессоров кэшируют предварительнопроцессоров кэшируют предварительно
дешифрованные команды.дешифрованные команды.
•ПрименяетсяПрименяется алгоритм динамического прогнози-алгоритм динамического прогнози-
рования ветвленийрования ветвлений ии метод переназначения регистровметод переназначения регистров
(позволяет реализовать внеочередное выполнение(позволяет реализовать внеочередное выполнение
команд).команд).
•Изготавливаются по КМОП технологии с 4-мя слоямиИзготавливаются по КМОП технологии с 4-мя слоями
металлизации.металлизации.
Повышение производительности RISC-Повышение производительности RISC-
процессоров достигается:процессоров достигается:
1)1) за счет повышения тактовый частотыза счет повышения тактовый частоты,,
2)2) усложнения схемы кристаллаусложнения схемы кристалла..
Представителями первого направления являютсяПредставителями первого направления являются
процессоры Alpha фирмы DECпроцессоры Alpha фирмы DEC (в 1995 году(в 1995 году
переименована в Digital UNIX, после покупки DECпереименована в Digital UNIX, после покупки DEC
компанией Compaq), наиболее сложными являютсякомпанией Compaq), наиболее сложными являются
процессоры компании Hewlett-Packard.процессоры компании Hewlett-Packard.
RISC-процессоры фирмы DEC.RISC-процессоры фирмы DEC.
Структура процессора Alpha 21064Структура процессора Alpha 21064 (1992 г.)(1992 г.)
BIU
E-box
IRF
A-box
Write Buffer
D-cache
I-box
F-box
FRF
I-cache
I-cache – кэш команд.I-cache – кэш команд.
IRF – регистровый файл целочисленной арифметики.IRF – регистровый файл целочисленной арифметики.
F-box – устройство арифметики с плавающей точкой.F-box – устройство арифметики с плавающей точкой.
E-box – устройство целочисленной арифметики (7E-box – устройство целочисленной арифметики (7
ступеней конвейера).ступеней конвейера).
I-box – командное устройство (управляет кэш команд,I-box – командное устройство (управляет кэш команд,
выборка и дешифрация команд).выборка и дешифрация команд).
A-box – устройство управления загрузкой/A-box – устройство управления загрузкой/
сохранением данных. Управляет процессом обменасохранением данных. Управляет процессом обмена
данными между IRF, FRF, кэш данных и внешнейданными между IRF, FRF, кэш данных и внешней
памятью.памятью.
Write Buffer – буфер обратной записи.Write Buffer – буфер обратной записи.
D-cache – кэш данных.D-cache – кэш данных.
BIU – интерфейсный блок, с помощью которогоBIU – интерфейсный блок, с помощью которого
подключаются внешняя кэш-память, размером 128 Кб - 8подключаются внешняя кэш-память, размером 128 Кб - 8
Мб.Мб.
Процессор Alpha 21264Процессор Alpha 21264 (1998 г.)(1998 г.)
Процессор Alpha 21264 отличается значительнойПроцессор Alpha 21264 отличается значительной
новизной по сравнению с предшественником 21164. Онновизной по сравнению с предшественником 21164. Он
обладает кэш-памятью первого уровня большего объема,обладает кэш-памятью первого уровня большего объема,
дополнительными функциональными блоками, болеедополнительными функциональными блоками, более
эффективными средствами предсказания ветвлений,эффективными средствами предсказания ветвлений,
новыми инструкциями обработки видеоданных и широкойновыми инструкциями обработки видеоданных и широкой
шиной.шиной.
Alpha 21264 читает до четырех инструкций за одинAlpha 21264 читает до четырех инструкций за один
такттакт и можети может одновременно исполнять до шестиодновременно исполнять до шести
инструкцийинструкций. Самое большое его отличие от модели 21164. Самое большое его отличие от модели 21164
-- это способность выполнять командыэто способность выполнять команды (впервые для(впервые для
Alpha)Alpha) с изменением их очередностис изменением их очередности (Out-of-Order).(Out-of-Order).
Как и большинство RISC-процессоров, AlphaКак и большинство RISC-процессоров, Alpha содержитсодержит
набор из 32 целочисленных и 32 регистров снабор из 32 целочисленных и 32 регистров с
плавающей запятойплавающей запятой, все они имеют, все они имеют разрядность 64разрядность 64
битабита. Для повышения эффективности внеочередного. Для повышения эффективности внеочередного
выполнения команд процессор 21264выполнения команд процессор 21264 дополнительнодополнительно кк
обычному набору регистров снабженобычному набору регистров снабжен еще 48еще 48
целочисленными регистрами и 40 регистрами сцелочисленными регистрами и 40 регистрами с
плавающей запятойплавающей запятой..
Каждый регистр может временно хранить значенияКаждый регистр может временно хранить значения
текущих команд. Если обрабатывается какая-либотекущих команд. Если обрабатывается какая-либо
инструкция, нет необходимости перегружать результат винструкция, нет необходимости перегружать результат в
целевой регистр - вместо этого ЦП простоцелевой регистр - вместо этого ЦП просто
переименовывает временный регистр (Register Renaming).переименовывает временный регистр (Register Renaming).
ВВ 2126421264 реализована уникальная хитрость - онреализована уникальная хитрость - он имеетимеет
задублированный набор целочисленных регистровзадублированный набор целочисленных регистров,,
каждый из 80 целочисленных регистров дублируется ещекаждый из 80 целочисленных регистров дублируется еще
раз. Таким образом, на чипе в целом -раз. Таким образом, на чипе в целом - 160160
целочисленных регистровцелочисленных регистров. Это одна из причин, почему,. Это одна из причин, почему,
несмотря на сложность выполнения Out-of-Order,несмотря на сложность выполнения Out-of-Order,
допустима высокая частота процессора 21264.допустима высокая частота процессора 21264.
В процессора 21264 в отличие от его пред-В процессора 21264 в отличие от его пред-
шественников практически полностью реорганизованашественников практически полностью реорганизована
иерархия кэш-памяти. Он снабжен одним 64-Кбайт кэшемиерархия кэш-памяти. Он снабжен одним 64-Кбайт кэшем
первого уровня (L1) для инструкций и еще одним 64-Кбайтпервого уровня (L1) для инструкций и еще одним 64-Кбайт
кэшем первого уровня для данных; оба являютсякэшем первого уровня для данных; оба являются
двукратно-ассоциативными. Кэш-память второго уровнядвукратно-ассоциативными. Кэш-память второго уровня
(L2) была вынесена за пределы чипа - к ней можно(L2) была вынесена за пределы чипа - к ней можно
обращаться через 128-бит backside-шину.обращаться через 128-бит backside-шину.
[По материалам В.Михайлов,СomputerWeekly, 41_98 c.25][По материалам В.Михайлов,СomputerWeekly, 41_98 c.25]
Сравнительные характеристикиСравнительные характеристики
Alpha 21164 и 21264Alpha 21164 и 21264
CPUCPU 2116421164 2126421264
Тактовая частота, МГцТактовая частота, МГц 600600 600600
Кэш L1Кэш L1 Емкость:8(I)+8(D)Емкость:8(I)+8(D) Емкость: 64(I)+64(D)Емкость: 64(I)+64(D)
Блокируется при числеБлокируется при числе
непопаданий равномнепопаданий равном
22 88
Число ФИУЧисло ФИУ 44 66
Емкость файлаЕмкость файла 32(I)32(I) 80(I), 2 копии80(I), 2 копии
РегистровРегистров 32(FP)32(FP) 72(FP)72(FP)
Переименование регистровПереименование регистров нетнет дада
Внеочередное выполнениеВнеочередное выполнение
командкоманд
нетнет дада
ДинамическоеДинамическое
предсказание переходовпредсказание переходов
дада усовершенствованноеусовершенствованное
Шина верхнего кэшаШина верхнего кэша системнаясистемная выделеннаявыделенная
Поддержка мультимедиаПоддержка мультимедиа нетнет дада
Число транзисторовЧисло транзисторов 9,3 млн9,3 млн 15,2 млн15,2 млн
Площадь, ммПлощадь, мм22
298298 302302
Первая версия,Первая версия, 2106421064 илиили EV4EV4, был первым КМОП, был первым КМОП
микропроцессором, рабочая частота которого сделала егомикропроцессором, рабочая частота которого сделала его
конкурентом миникомпьютерам и мейнфреймам,конкурентом миникомпьютерам и мейнфреймам,
использовавшим гораздо более энергоёмкую элементнуюиспользовавшим гораздо более энергоёмкую элементную
базу ЭСЛ. Второе поколение,базу ЭСЛ. Второе поколение, 2116421164 илиили EV5EV5, был первым, был первым
микропроцессором, имевшим накристальный L2-кэшмикропроцессором, имевшим накристальный L2-кэш
большого объёма. Процессорбольшого объёма. Процессор 2126421264 ((EV6EV6), был первым), был первым
микропроцессором, совместившим в себе как высокуюмикропроцессором, совместившим в себе как высокую
рабочую частоту, так и сложнуюрабочую частоту, так и сложную out-of-order executionout-of-order execution
микроархитектуру.микроархитектуру.
Выпуск процессоров архитектуры DEC Alpha былВыпуск процессоров архитектуры DEC Alpha был
прекращён 27 октября 2007 года.прекращён 27 октября 2007 года.
Процессор Alpha и заложенные в нём концепции прямоПроцессор Alpha и заложенные в нём концепции прямо
или косвенно оказали влияние на конструкцию другихили косвенно оказали влияние на конструкцию других
процессоров и на развитие отрасли в целом.процессоров и на развитие отрасли в целом.
В оригинальном процессоре AMD AthlonВ оригинальном процессоре AMD Athlon
использовалась шина, первоначально разработанная дляиспользовалась шина, первоначально разработанная для
Alpha. В процессоре AMD Opteron применяетсяAlpha. В процессоре AMD Opteron применяется
высокоскоростная межпроцессорная магистральвысокоскоростная межпроцессорная магистраль
HyperTransport и встроенный контроллер памяти —HyperTransport и встроенный контроллер памяти —
технологии, аналогичные тем, которые первымитехнологии, аналогичные тем, которые первыми
предложили разработчики Alpha. Дирк Мейер, главныйпредложили разработчики Alpha. Дирк Мейер, главный
инженер процессоров AMD, раньше работал над Alpha.инженер процессоров AMD, раньше работал над Alpha.
Применяемая в серверных и настольных процессорахПрименяемая в серверных и настольных процессорах
Intel технология HyperThreading, позволяющая процессоруIntel технология HyperThreading, позволяющая процессору
решать несколько задач одновременно, навеянарешать несколько задач одновременно, навеяна
исследованиями в области многопоточности,исследованиями в области многопоточности,
проведёнными командой Alpha в DEC в 1990-е годы.проведёнными командой Alpha в DEC в 1990-е годы.
Процессоры PA-RISCПроцессоры PA-RISC
компании Hewlett-Packardкомпании Hewlett-Packard
PA-RISC — микропроцессорная архитектура,PA-RISC — микропроцессорная архитектура,
разработанная компанией Hewlett-Packard.разработанная компанией Hewlett-Packard.
Первый RISC-процессор серии PA (PreciseПервый RISC-процессор серии PA (Precise
Architecture), работавший на частоте 8 МГц, компания НРArchitecture), работавший на частоте 8 МГц, компания НР
выпустила еще в 1985 году.выпустила еще в 1985 году.
Процессор PA-8000 (1996 г.) вобрал в себя всеПроцессор PA-8000 (1996 г.) вобрал в себя все
известные методы ускорения выполнения команд. В егоизвестные методы ускорения выполнения команд. В его
основе лежитоснове лежит концепция "интеллектуальногоконцепция "интеллектуального
выполнения",выполнения", котораякоторая базируется на принципебазируется на принципе
внеочередного выполнения командвнеочередного выполнения команд..
Процессоры PA-RISCПроцессоры PA-RISC
компании Hewlett-Packardкомпании Hewlett-Packard
Эти средства хорошо дополняют другие архитектурныеЭти средства хорошо дополняют другие архитектурные
компоненты, заложенные в структуру кристалла:компоненты, заложенные в структуру кристалла:
 большое число исполнительныхбольшое число исполнительных
функциональных устройств;функциональных устройств;
 средства прогнозирования направлениясредства прогнозирования направления
переходов;переходов;
 выполнения команд по предположению;выполнения команд по предположению;
 оптимизированная организация кэш-памяти;оптимизированная организация кэш-памяти;
 высокопроизводительный шинный интерфейсвысокопроизводительный шинный интерфейс..
Высокая производительность PA-8000 во многомВысокая производительность PA-8000 во многом
определяется наличием большого набораопределяется наличием большого набора
функциональных устройств, который включает в себяфункциональных устройств, который включает в себя 1010
исполнительных устройствисполнительных устройств: два арифметико-логических: два арифметико-логических
устройства (АЛУ) для выполнения целочисленныхустройства (АЛУ) для выполнения целочисленных
операций, два устройства для выполнения операцийопераций, два устройства для выполнения операций
сдвига/слияния данных, два устройства для выполнениясдвига/слияния данных, два устройства для выполнения
умножения/сложения чисел с плавающей точкой, дваумножения/сложения чисел с плавающей точкой, два
устройства деления/вычисления квадратного корня и дваустройства деления/вычисления квадратного корня и два
устройства выполнения операций загрузки/записи.устройства выполнения операций загрузки/записи.
Средства внеочередного выполнения командСредства внеочередного выполнения команд
процессора PA-8000 обеспечивают аппаратноепроцессора PA-8000 обеспечивают аппаратное
планирование загрузки конвейеров и лучшеепланирование загрузки конвейеров и лучшее
использование функциональных устройств.использование функциональных устройств. В каждомВ каждом
такте на выполнение могут выдаваться до четырехтакте на выполнение могут выдаваться до четырех
командкоманд, которые поступают в 56-строчный буфер, которые поступают в 56-строчный буфер
переупорядочивания.переупорядочивания.
Кристалл может анализировать все 56 командныхКристалл может анализировать все 56 командных
строк одновременно и выдавать в каждом такте по 4строк одновременно и выдавать в каждом такте по 4
готовых для выполнения команды в функциональныеготовых для выполнения команды в функциональные
устройства. Это позволяет процессоруустройства. Это позволяет процессору автоматическиавтоматически
выявлять параллелизм уровня выполнения командвыявлять параллелизм уровня выполнения команд..
Суперскалярный процессор PA-8000Суперскалярный процессор PA-8000 обеспечиваетобеспечивает
полный набор средств выполнения 64-битовыхполный набор средств выполнения 64-битовых
операций, включая адресную арифметику, а такжеопераций, включая адресную арифметику, а также
арифметику с фиксированной и плавающей точкой. Приарифметику с фиксированной и плавающей точкой. При
этом кристалл полностью сохраняет совместимость с 32-этом кристалл полностью сохраняет совместимость с 32-
битовыми приложениями и с предыдущими и будущимибитовыми приложениями и с предыдущими и будущими
реализациями PA-RISC. Этореализациями PA-RISC. Это первый процессор, впервый процессор, в
котором реализована 64-битовая архитектура PA-котором реализована 64-битовая архитектура PA-
RISCRISC..
 PA-8200 (1997 г.) представляет собой суперскалярныйPA-8200 (1997 г.) представляет собой суперскалярный
64-битный RISC-процессор и реализует архитектуру64-битный RISC-процессор и реализует архитектуру PA-PA-
RISC 2.0RISC 2.0. Существуют две версии этого процессора,. Существуют две версии этого процессора,
работающие на частотах 200 и 240 MHz. При тактовойработающие на частотах 200 и 240 MHz. При тактовой
частоте вчастоте в 240 MHz240 MHz процессор обеспечивает пиковуюпроцессор обеспечивает пиковую
производительность впроизводительность в 960 MFLOPS960 MFLOPS, за счет, за счет
одновременного исполнения 4 инструкцийодновременного исполнения 4 инструкций с плавающейс плавающей
точкой.точкой.
 Процессор PA-8200 включает следующие архитектурныеПроцессор PA-8200 включает следующие архитектурные
особенности:особенности:
Раздельные первичныеРаздельные первичные кэшикэши кода и данных, каждый покода и данных, каждый по 22
MBMB. Особенностью архитектуры PA-RISC является. Особенностью архитектуры PA-RISC является
внекристальнаявнекристальная реализация кэша, что позволяетреализация кэша, что позволяет
увеличивать его объем при необходимости. Кэш-памятьувеличивать его объем при необходимости. Кэш-память
второго уровня не используется.второго уровня не используется.
 10 независимых10 независимых функциональных устройствфункциональных устройств::
 Два 64-разрядных целочисленных АЛУДва 64-разрядных целочисленных АЛУ
 Два целочисленных устройства сдвигаДва целочисленных устройства сдвига
 Два устройства умножения и сложения для чисел сДва устройства умножения и сложения для чисел с
плавающей точкойплавающей точкой
 Два устройства деления и извлечения корня дляДва устройства деления и извлечения корня для
чисел с плавающей точкойчисел с плавающей точкой
 Два устройства чтения/записи данныхДва устройства чтения/записи данных
 БуферБуфер переупорядочения инструкцийпереупорядочения инструкций на 56 позиций;на 56 позиций;
переупорядоченное выполнение инструкций позволяетпереупорядоченное выполнение инструкций позволяет
постоянно поддерживать суперскалярный режим работыпостоянно поддерживать суперскалярный режим работы
процессора. Устройство считывания инструкцийпроцессора. Устройство считывания инструкций
доставляет в буфердоставляет в буфер 4 инструкции4 инструкции за такт.за такт.
 УправляемаяУправляемая предвыборкапредвыборка данных из основной памятиданных из основной памяти
в кэш.в кэш.
 Статическое и динамическое предсказание ветвленийСтатическое и динамическое предсказание ветвлений
 64-битная64-битная адресация памятиадресация памяти
 Встроенная программируемая аппаратураВстроенная программируемая аппаратура мониторингамониторинга
производительности; позволяет отслеживать такиепроизводительности; позволяет отслеживать такие
события как кэш-попадания (промахи), ошибки всобытия как кэш-попадания (промахи), ошибки в
предсказании ветвлений, и т.д.предсказании ветвлений, и т.д.
18 сентября 2001 года на рынок вышел процессор PA-18 сентября 2001 года на рынок вышел процессор PA-
8700. Данный чип стал первым решением НР,8700. Данный чип стал первым решением НР,
использующим медные соединения и SOI-транзисторы.использующим медные соединения и SOI-транзисторы.
Построенный с применением технологии 0,18 мк, онПостроенный с применением технологии 0,18 мк, он
позволил достичь частоты 875 МГц.позволил достичь частоты 875 МГц.
HP прекратила продажи машин HP 9000, основанныхHP прекратила продажи машин HP 9000, основанных
на PA-RISC, в конце 2008 года. Поддержка серверов нана PA-RISC, в конце 2008 года. Поддержка серверов на
процессорах PA-RISC была продолжена до 2013 года.процессорах PA-RISC была продолжена до 2013 года.
Из HP в Intel перешли более 300 инженеровИз HP в Intel перешли более 300 инженеров
работавших над Alpha, большинство из них работало надработавших над Alpha, большинство из них работало над
процессором Itanium 2.процессором Itanium 2.
Предполагалось, что новые машины, основанныеПредполагалось, что новые машины, основанные
на Itanium, смогут заменить PA-RISC.на Itanium, смогут заменить PA-RISC.
Itanium представляет собой совместный проект сItanium представляет собой совместный проект с
Intel. При этом НР по праву считает ItaniumIntel. При этом НР по праву считает Itanium
наследником PA-RISC.наследником PA-RISC.
Пиковая производительность RISCПиковая производительность RISC
– процессоров на конец XX века– процессоров на конец XX века
МикропроцессорМикропроцессор Частота, МГцЧастота, МГц Производительность,Производительность,
MFLOPSMFLOPS
DEC Alpha 21164DEC Alpha 21164 700700 14001400
DEC Alpha 21264DEC Alpha 21264 800800 16001600
HP PA-8000HP PA-8000 180180 720720
HP PA-8200HP PA-8200 236236 944944
HP PA-8500HP PA-8500 400400 16001600
SGI/MIPS R10000SGI/MIPS R10000 250250 500500
SGI/MIPS R12000SGI/MIPS R12000 300300 600600
Sun UltraSPARC IISun UltraSPARC II 300300 600600
Sun UltraSPARC IIISun UltraSPARC III 600600 12001200
Особенности процессоров сОсобенности процессоров с
архитектурой SPARC компанииархитектурой SPARC компании
Sun MicrosystemsSun Microsystems
SPARC (Scalable Processor ARChitecture —SPARC (Scalable Processor ARChitecture —
масштабируемая архитектура процессора) — архитектурамасштабируемая архитектура процессора) — архитектура
RISC-микропроцессоров, первоначально разработанная вRISC-микропроцессоров, первоначально разработанная в
1985 году компанией Sun Microsystems.1985 году компанией Sun Microsystems.
Архитектура SPARC является открытой, что означает:Архитектура SPARC является открытой, что означает:
Архитектура системы команд SPARC опубликованаАрхитектура системы команд SPARC опубликована
как стандарт IEEE 1754—1994;как стандарт IEEE 1754—1994;
Спецификации SPARC доступны для лицензированияСпецификации SPARC доступны для лицензирования
любой компанией или частным лицом и дают возможностьлюбой компанией или частным лицом и дают возможность
разрабатывать свои собственные решения;разрабатывать свои собственные решения;
 Развитием архитектуры SPARC занимаетсяРазвитием архитектуры SPARC занимается
независимая некоммерческая организация SPARCнезависимая некоммерческая организация SPARC
International, Inc., основанная в 1989 году. Членство вInternational, Inc., основанная в 1989 году. Членство в
SPARC International открыто для всех желающих.SPARC International открыто для всех желающих.
Для производства процессоров с архитектурой SPARCДля производства процессоров с архитектурой SPARC
достаточно закупить у SPARC International, Inc. лицензиюдостаточно закупить у SPARC International, Inc. лицензию
на архитектуру системы команд ($99) и разработать своюна архитектуру системы команд ($99) и разработать свою
реализацию архитектуры, либо закупить готовуюреализацию архитектуры, либо закупить готовую
реализацию (что несколько дороже).реализацию (что несколько дороже).
Существовало 3 основные ревизии архитектурыСуществовало 3 основные ревизии архитектуры
SPARC: версии 7, 8 и 9. Иногда UltraSPARC серии TSPARC: версии 7, 8 и 9. Иногда UltraSPARC серии T
выделяются как отдельные архитектуры UltraSPARCвыделяются как отдельные архитектуры UltraSPARC
Architecture 2005 и 2007.Architecture 2005 и 2007.
Версия 8 архитектуры SPARC описывает 32-разрядныйВерсия 8 архитектуры SPARC описывает 32-разрядный
микропроцессор, тогда как версия 9 — 64-разрядный.микропроцессор, тогда как версия 9 — 64-разрядный.
Процессоры с архитектурой SPARC лицензированы иПроцессоры с архитектурой SPARC лицензированы и
изготавливаются по спецификациям Sun несколькимиизготавливаются по спецификациям Sun несколькими
производителями, среди которых следует отметитьпроизводителями, среди которых следует отметить
компании Texas Instruments, Fujitsu, LSI Logic, Bipolarкомпании Texas Instruments, Fujitsu, LSI Logic, Bipolar
International Technology, Philips и Cypress Semiconductor.International Technology, Philips и Cypress Semiconductor.
В 1990 году Sun передала все права на архитектуруВ 1990 году Sun передала все права на архитектуру
SPARC организации SPARC International,SPARC организации SPARC International, которая вкоторая в
настоящее время включаетнастоящее время включает более 250 членов.более 250 членов.
SuperSPARC (1992 г.)SuperSPARC (1992 г.)
ДальнейшееДальнейшее увеличение производительностиувеличение производительности
процессоров с архитектурой SPARC былопроцессоров с архитектурой SPARC было достигнуто за счетдостигнуто за счет
реализации в кристаллах принципов суперскалярнойреализации в кристаллах принципов суперскалярной
обработкиобработки компаниямикомпаниями Texas Instruments и Cypress.Texas Instruments и Cypress.
Процессор SuperSPARC стал основой серии рабочих станций иПроцессор SuperSPARC стал основой серии рабочих станций и
серверов SPARCstation/SPARCserver 10 исерверов SPARCstation/SPARCserver 10 и
SPARCstation/SPARCserver 20. Имеется несколько версий этогоSPARCstation/SPARCserver 20. Имеется несколько версий этого
процессора, позволяющего в зависимости от смеси командпроцессора, позволяющего в зависимости от смеси команд
обрабатыватьобрабатывать до трех команд за один машинный тактдо трех команд за один машинный такт,,
отличающихся тактовой частотой. Процессор имеетотличающихся тактовой частотой. Процессор имеет
сбалансированную производительность на операциях ссбалансированную производительность на операциях с
фиксированной и плавающей точкой,фиксированной и плавающей точкой, внутренний кэшвнутренний кэш
емкостью 36 Кб (20 Кб - кэш команд и 16 Кб - кэш данныхемкостью 36 Кб (20 Кб - кэш команд и 16 Кб - кэш данных),),
раздельные конвейеры целочисленной и вещественнойраздельные конвейеры целочисленной и вещественной
арифметики и при тактовой частоте 75 МГц обеспечиваетарифметики и при тактовой частоте 75 МГц обеспечивает
производительность около 205 MIPS.производительность около 205 MIPS.
Процессор SuperSPARC применяется также в серверахПроцессор SuperSPARC применяется также в серверах
SPARCserver 1000 и SPARCcenter 2000 компании Sun.SPARCserver 1000 и SPARCcenter 2000 компании Sun.
hyperSPARC (1993 г.)hyperSPARC (1993 г.)
Процессорный набор hyperSPARC с тактовой частотойПроцессорный набор hyperSPARC с тактовой частотой
100 МГц построен на основе технологического процесса100 МГц построен на основе технологического процесса
КМОП с тремя уровнями металлизации и проектнымиКМОП с тремя уровнями металлизации и проектными
нормами 0.5 микрон. Внутренняя логика работает снормами 0.5 микрон. Внутренняя логика работает с
напряжением питания 3.3 В.напряжением питания 3.3 В.
Процессор hyperSPARC реализован в видеПроцессор hyperSPARC реализован в виде
многокристальной микросборкимногокристальной микросборки, в состав которой входит, в состав которой входит
суперскалярная конвейерная часть и тесно связанная с нейсуперскалярная конвейерная часть и тесно связанная с ней
кэш-память второго уровня. В набор кристаллов входяткэш-память второго уровня. В набор кристаллов входят
RT620 (CPU) - центральный процессор, RT625 (CMTU) -RT620 (CPU) - центральный процессор, RT625 (CMTU) -
контроллер кэш-памяти, устройство управления памятью иконтроллер кэш-памяти, устройство управления памятью и
устройство тегов, четыре RT627 (CDU) - кэш-памятьустройство тегов, четыре RT627 (CDU) - кэш-память
данных для реализации кэш-памяти второго уровняданных для реализации кэш-памяти второго уровня
емкостью 256 Кбайт. RT625 обеспечивает также интерфейсемкостью 256 Кбайт. RT625 обеспечивает также интерфейс
с MBus.с MBus.
MicroSPARC-II (1994 г.)MicroSPARC-II (1994 г.)
MicroSPARC-II представляет собойMicroSPARC-II представляет собой
высокоинтегрированную микросхему, содержащуювысокоинтегрированную микросхему, содержащую
целочисленное устройство, устройство управленияцелочисленное устройство, устройство управления
памятью, устройство плавающей точки, раздельную кэш-памятью, устройство плавающей точки, раздельную кэш-
память команд и данных, контроллер управленияпамять команд и данных, контроллер управления
микросхемами динамической памяти и контроллер шинымикросхемами динамической памяти и контроллер шины
SBus.SBus.
Основными свойствами целочисленного устройстваОсновными свойствами целочисленного устройства
microSPARC-II являются:microSPARC-II являются:
пятиступенчатый конвейер команд;пятиступенчатый конвейер команд;
предварительная обработка команд переходов;предварительная обработка команд переходов;
поддержка потокового режима работы кэш-памятиподдержка потокового режима работы кэш-памяти
команд и данных;команд и данных;
регистровый файл емкостью 136 регистроврегистровый файл емкостью 136 регистров (8(8
регистровых окон);регистровых окон);
интерфейс с устройством плавающей точки;интерфейс с устройством плавающей точки;
предварительная выборка команд с очередью напредварительная выборка команд с очередью на
четыре команды.четыре команды.
В 2009 году компания Oracle купила компанию Sun.В 2009 году компания Oracle купила компанию Sun.
Новые серверы линеек SPARC T5 и M5 работают подНовые серверы линеек SPARC T5 и M5 работают под
управлением ОС Oracle Solaris. Они относятся к среднемууправлением ОС Oracle Solaris. Они относятся к среднему
и верхнему сегменту производительности и предназначеныи верхнему сегменту производительности и предназначены
для корпоративных приложений, интенсивно работающих сдля корпоративных приложений, интенсивно работающих с
базами данных, а также критически важных бизнес-базами данных, а также критически важных бизнес-
приложений.приложений.
Основой серверов SPARC T5 стал одноименныйОсновой серверов SPARC T5 стал одноименный
процессор, который Oracle называет самым быстрым впроцессор, который Oracle называет самым быстрым в
мире микропроцессором.мире микропроцессором. Микропроцессор с 16 ядрамиМикропроцессор с 16 ядрами
работает на частоте 3,6 ГГц,работает на частоте 3,6 ГГц, одновременно выполняя доодновременно выполняя до
128 потоков команд. В конфигурацию процессора входит 8128 потоков команд. В конфигурацию процессора входит 8
МБ совместно используемой кэш-памяти третьего уровня иМБ совместно используемой кэш-памяти третьего уровня и
по 128 КБ кэш-памяти второго уровня в расчете на каждоепо 128 КБ кэш-памяти второго уровня в расчете на каждое
ядро.ядро.
Oracle SPARC T5-8 — самый быстрый одиночныйOracle SPARC T5-8 — самый быстрый одиночный
сервер для Oracle Database и для Oracle Middleware. Посервер для Oracle Database и для Oracle Middleware. По
соотношению цены и производительности он в 12 разсоотношению цены и производительности он в 12 раз
превосходит сервер IBM Power 780.превосходит сервер IBM Power 780.
Помимо SPARC T5-8, список
новинок включает серверный
модуль SPARC T5-1B,
серверы SPARC T5-2, SPARC
T5-4 и SPARC M5-32 (в ней
используются шестиядерные
процессоры T5).
«Computerworld Россия», № 21, 2013«Computerworld Россия», № 21, 2013
Процессор SPARC M6 имеет 12 ядер — в два разаПроцессор SPARC M6 имеет 12 ядер — в два раза
больше, чем у его предшественника SPARC M5. Каждоебольше, чем у его предшественника SPARC M5. Каждое
ядро M6 способно одновременно выполнять 8 потоков.ядро M6 способно одновременно выполнять 8 потоков.
Общее число потоков, одновременно обрабатываемыхОбщее число потоков, одновременно обрабатываемых
чипом, может достигать 96.чипом, может достигать 96.
Новые чипы могут устанавливаться в двух-, четырех- иНовые чипы могут устанавливаться в двух-, четырех- и
восьмипроцессорные серверы, однако использованиевосьмипроцессорные серверы, однако использование
специальных устройств Bixby позволит строить 32-, 48- испециальных устройств Bixby позволит строить 32-, 48- и
даже 96-процессорные серверы с разделением памяти идаже 96-процессорные серверы с разделением памяти и
других ресурсов. M6 призван сбалансироватьдругих ресурсов. M6 призван сбалансировать
производительность серверов, уменьшить задержки ипроизводительность серверов, уменьшить задержки и
обеспечить быструю обработку транзакций. Функцииобеспечить быструю обработку транзакций. Функции
связности для больших систем разрабатывались с нуля исвязности для больших систем разрабатывались с нуля и
могут применяться к небольшим серверным пулам.могут применяться к небольшим серверным пулам.
«Computerworld Россия», № 21, 2013«Computerworld Россия», № 21, 2013
Компания Fujitsu анонсировала новейший 16-ядерныйКомпания Fujitsu анонсировала новейший 16-ядерный
чип SPARC X+ для мэйнфреймов. Процессор работает начип SPARC X+ для мэйнфреймов. Процессор работает на
частоте 3,5 ГГц и выше и может использоваться вчастоте 3,5 ГГц и выше и может использоваться в
мэйнфреймах с 64-процессорной конфигурацией. Каждоемэйнфреймах с 64-процессорной конфигурацией. Каждое
ядро одновременно обрабатывает два потока, в общей жеядро одновременно обрабатывает два потока, в общей же
сложности мэйнфрейм способен параллельно выполнятьсложности мэйнфрейм способен параллельно выполнять
2048 потоков.2048 потоков.
В ноябре 2002 года микропроцессоры SPARCВ ноябре 2002 года микропроцессоры SPARC
использовались в 88 из 500 (17,60 %) самых мощныхиспользовались в 88 из 500 (17,60 %) самых мощных
компьютеров, однако с тех пор потеряли популярность,компьютеров, однако с тех пор потеряли популярность,
будучи заменены на процессоры от IBM, Intel и AMD.будучи заменены на процессоры от IBM, Intel и AMD.
По состоянию на июль 2009 только одинПо состоянию на июль 2009 только один
суперкомпьютер на процессорах SPARC включён в списоксуперкомпьютер на процессорах SPARC включён в список
самых быстрых компьютеров TOP500. Находящийся на 28самых быстрых компьютеров TOP500. Находящийся на 28
месте суперкомпьютер Fujitsu FX1 используетместе суперкомпьютер Fujitsu FX1 использует
четырёхядерные микропроцессоры SPARC64 VII 2,52 ГГц ичетырёхядерные микропроцессоры SPARC64 VII 2,52 ГГц и
имеет производительность 121 282 GFLOPS. Онимеет производительность 121 282 GFLOPS. Он
установлен в Японском агентстве аэрокосмическихустановлен в Японском агентстве аэрокосмических
исследований.исследований.
В 2011 году самым быстрым суперкомпьютером вВ 2011 году самым быстрым суперкомпьютером в
рейтинге TOP500 признан «K computer» компании Fujitsuрейтинге TOP500 признан «K computer» компании Fujitsu
он собран из 68 544 восьмиядерных процессоровон собран из 68 544 восьмиядерных процессоров
SPARC64 VIIIfx и его мощность составляет 8,16 Пфлопс,SPARC64 VIIIfx и его мощность составляет 8,16 Пфлопс,
пиковая 8,77 Пфлопс.пиковая 8,77 Пфлопс.
Микропроцессоры архитектурыМикропроцессоры архитектуры SPARCSPARC лицензированылицензированы
и изготавливаются по спецификациями изготавливаются по спецификациям SunSun несколькиминесколькими
производителями, в том числе ЗАО «МЦСТ».производителями, в том числе ЗАО «МЦСТ».
МЦСТ (закрытое акционерное общество (ЗАО) «МЦСТ») —МЦСТ (закрытое акционерное общество (ЗАО) «МЦСТ») —
российская компания, специализирующаяся на разработкероссийская компания, специализирующаяся на разработке
универсальных микропроцессоров, микроконтроллеров иуниверсальных микропроцессоров, микроконтроллеров и
управляющих вычислительных комплексов. Имеет опыт разработкиуправляющих вычислительных комплексов. Имеет опыт разработки
супер-ЭВМ «Эльбрус». Также в компании ведутся разработкисупер-ЭВМ «Эльбрус». Также в компании ведутся разработки
оптимизирующих и двоичных компиляторов, операционных систем.оптимизирующих и двоичных компиляторов, операционных систем.
ЗАО «МЦСТ» является базовой организацией кафедры информатики иЗАО «МЦСТ» является базовой организацией кафедры информатики и
вычислительной техники Московского физико-технического институтавычислительной техники Московского физико-технического института
(государственного университета).(государственного университета).
Процессоры архитектурыПроцессоры архитектуры SPARC V8SPARC V8 (МЦСТ R150 и(МЦСТ R150 и
МЦСТ R500) – первые продукты ЗАО «МЦСТ».) – первые продукты ЗАО «МЦСТ».
Структура ядра
микропроцессора МЦСТ
R500
Кэш команд первого уровня (I$) –
составляет 16 Кбайт.
2 регистровых файла:
- регистровый файл
целочисленных данных содержит
136 регистров по 32 бита (8 окон по
16 регистров и 1 окно из 8
глобальных регистров).
- регистровый файл
вещественных данных содержит
32 регистра 32-разрядных данных.
При этом модуль может
трактоваться в программах как
набор из 32 регистров одинарного
формата (разрядность 32 бита),
либо как 16 регистров двойного
формата (разрядность 64 бита),
либо как смешанный набор
регистров первого и второго вида.
Процессоры ARMПроцессоры ARM
ARM-процессоры – 32-битные чипы на базеARM-процессоры – 32-битные чипы на базе
архитектуры RISC (Reduced Instruction Set Computer), тоархитектуры RISC (Reduced Instruction Set Computer), то
есть с сокращённым набором команд. В основу этойесть с сокращённым набором команд. В основу этой
архитектуры положена идея повышения быстродействияархитектуры положена идея повышения быстродействия
за счёт максимального упрощения инструкций иза счёт максимального упрощения инструкций и
ограничения их длины.ограничения их длины.
Современные ARM-процессоры – это суперскалярныеСовременные ARM-процессоры – это суперскалярные
суперконвейерные микросхемы, построенные на основесуперконвейерные микросхемы, построенные на основе
RISC-архитектуры.RISC-архитектуры.
На основе Cortex-A8На основе Cortex-A8
построен модныйпостроен модный
планшет Apple iPad.планшет Apple iPad.
Первые чипы на базеПервые чипы на базе
Cortex-A9 – NVIDIACortex-A9 – NVIDIA
Tegra 2 – этоTegra 2 – это
двухъядерныедвухъядерные
микросхемы смикросхемы с
графическим ядром,графическим ядром,
поддерживающимподдерживающим
видео формата Fullвидео формата Full
HD 1080p иHD 1080p и
трёхмерную графикутрёхмерную графику
с программнымс программным
интерфейсом OpenGLинтерфейсом OpenGL
ES 2.0.ES 2.0.
Представлен процессорПредставлен процессор ARM Cortex-A17ARM Cortex-A17
11.02.2014г.11.02.2014г.
По оценке
разработчика,
процессор ARM
Cortex-A17 по
производительно
сти превосходит
процессор ARM
Cortex-A9 на
60%. Кроме того,
он имеет лучшие
показатели
энергетической
эффективности и
использования
площади
кристалла.
Источник:
http://www.ixbt.com/news/hard/index.shtml?17/65/10
Области примененияОбласти применения
RISC - процессоровRISC - процессоров
1.1. Рабочие станции высшего ценового класса (12-15Рабочие станции высшего ценового класса (12-15
тыс.$). Работают под ОС VMS, Unix.тыс.$). Работают под ОС VMS, Unix.
2.2. Персональные рабочие станции (3-7 тыс. $). ОС:Персональные рабочие станции (3-7 тыс. $). ОС:
Windows NT, Solaris.Windows NT, Solaris.
3.3. Серверы.Серверы.
4.4. RISC ПК.RISC ПК.
Вопросы для самоконтроляВопросы для самоконтроля
1.1. С чем связано появление RISC-процессоров?С чем связано появление RISC-процессоров?
2.2. Основные особенности RISC-процессоров.Основные особенности RISC-процессоров.
3.3. Назовите фирмы-разработчики RISC процессоров.Назовите фирмы-разработчики RISC процессоров.
4.4. Архитектурные особенности процессоров Alpha.Архитектурные особенности процессоров Alpha.
5.5. Архитектурные особенности процессора PA-8000.Архитектурные особенности процессора PA-8000.
6.6. Области применения RISC-процессоров.Области применения RISC-процессоров.

More Related Content

What's hot

Лекция 1: Архитектурно-ориентированная оптимизация программного обеспечения (...
Лекция 1: Архитектурно-ориентированная оптимизация программного обеспечения (...Лекция 1: Архитектурно-ориентированная оптимизация программного обеспечения (...
Лекция 1: Архитектурно-ориентированная оптимизация программного обеспечения (...
Mikhail Kurnosov
 
Лекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и системЛекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и систем
pianist2317
 
Операционные системы
Операционные системыОперационные системы
Операционные системы
yaevents
 
Обзор процессоров Phillips Nexperia
Обзор процессоров Phillips NexperiaОбзор процессоров Phillips Nexperia
Обзор процессоров Phillips Nexperia
MSU GML VideoGroup
 
Лекция №6 Организация ЭВМ и систем
Лекция №6 Организация ЭВМ и системЛекция №6 Организация ЭВМ и систем
Лекция №6 Организация ЭВМ и систем
pianist2317
 
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Mikhail Kurnosov
 
Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора
Yandex
 
Лекция №2 Организация ЭВМ и систем
Лекция №2 Организация ЭВМ и системЛекция №2 Организация ЭВМ и систем
Лекция №2 Организация ЭВМ и систем
pianist2317
 
ARM vs Intel microarchitecture
ARM vs Intel microarchitectureARM vs Intel microarchitecture
ARM vs Intel microarchitecture
Ilya Kryukov
 

What's hot (14)

Лекция 1: Архитектурно-ориентированная оптимизация программного обеспечения (...
Лекция 1: Архитектурно-ориентированная оптимизация программного обеспечения (...Лекция 1: Архитектурно-ориентированная оптимизация программного обеспечения (...
Лекция 1: Архитектурно-ориентированная оптимизация программного обеспечения (...
 
Лекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и системЛекция №9 Организация ЭВМ и систем
Лекция №9 Организация ЭВМ и систем
 
Chipset
ChipsetChipset
Chipset
 
Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...
Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...
Лекция 2. Оптимизация ветвлений и циклов (Branch prediction and loop optimiz...
 
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
Ликбез по Эльбрусу, Константин Трушкин (МЦСТ)
 
Что нового в NOVA Microhypervisor
Что нового в NOVA MicrohypervisorЧто нового в NOVA Microhypervisor
Что нового в NOVA Microhypervisor
 
Операционные системы
Операционные системыОперационные системы
Операционные системы
 
Обзор процессоров Phillips Nexperia
Обзор процессоров Phillips NexperiaОбзор процессоров Phillips Nexperia
Обзор процессоров Phillips Nexperia
 
Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 3. Векторизация кода (Code vectorization: SSE, AVX)
 
Лекция №6 Организация ЭВМ и систем
Лекция №6 Организация ЭВМ и системЛекция №6 Организация ЭВМ и систем
Лекция №6 Организация ЭВМ и систем
 
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
Лекция 3: Векторизация кода (Code vectorization, SIMD, SSE, AVX)
 
Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора Вячеслав Бирюков - Linux инструменты системного администратора
Вячеслав Бирюков - Linux инструменты системного администратора
 
Лекция №2 Организация ЭВМ и систем
Лекция №2 Организация ЭВМ и системЛекция №2 Организация ЭВМ и систем
Лекция №2 Организация ЭВМ и систем
 
ARM vs Intel microarchitecture
ARM vs Intel microarchitectureARM vs Intel microarchitecture
ARM vs Intel microarchitecture
 

Viewers also liked

Лекция №10 Организация ЭВМ и систем
Лекция №10 Организация ЭВМ и системЛекция №10 Организация ЭВМ и систем
Лекция №10 Организация ЭВМ и систем
pianist2317
 
Лекция №14 Организация ЭВМ и систем
Лекция №14 Организация ЭВМ и системЛекция №14 Организация ЭВМ и систем
Лекция №14 Организация ЭВМ и систем
pianist2317
 
Лекция №12 Организация ЭВМ и систем
Лекция №12 Организация ЭВМ и системЛекция №12 Организация ЭВМ и систем
Лекция №12 Организация ЭВМ и систем
pianist2317
 
Лекция №8 Организация ЭВМ и систем
Лекция №8 Организация ЭВМ и системЛекция №8 Организация ЭВМ и систем
Лекция №8 Организация ЭВМ и систем
pianist2317
 
Лекция №13 Организация ЭВМ и систем
Лекция №13 Организация ЭВМ и системЛекция №13 Организация ЭВМ и систем
Лекция №13 Организация ЭВМ и систем
pianist2317
 
Actividades diarias
Actividades diariasActividades diarias
Actividades diarias
karen1115
 
Лекция №11 Организация ЭВМ и систем
Лекция №11 Организация ЭВМ и системЛекция №11 Организация ЭВМ и систем
Лекция №11 Организация ЭВМ и систем
pianist2317
 
Лекция №4(часть 1) Организация ЭВМ и систем
Лекция №4(часть 1) Организация ЭВМ и системЛекция №4(часть 1) Организация ЭВМ и систем
Лекция №4(часть 1) Организация ЭВМ и систем
pianist2317
 
лекция 5 представление информации в эвм информатика
лекция 5 представление информации в эвм информатикалекция 5 представление информации в эвм информатика
лекция 5 представление информации в эвм информатика
Gulnaz Shakirova
 
лекция 6 представление информации в эвм информатика
лекция 6 представление информации в эвм информатикалекция 6 представление информации в эвм информатика
лекция 6 представление информации в эвм информатика
Gulnaz Shakirova
 
Лекция №4(часть 2) Организация ЭВМ и систем
Лекция №4(часть 2) Организация ЭВМ и системЛекция №4(часть 2) Организация ЭВМ и систем
Лекция №4(часть 2) Организация ЭВМ и систем
pianist2317
 
Лекция №15 Организация ЭВМ и систем
Лекция №15 Организация ЭВМ и системЛекция №15 Организация ЭВМ и систем
Лекция №15 Организация ЭВМ и систем
pianist2317
 
Лекция №5 Организация ЭВМ и систем
Лекция №5 Организация ЭВМ и системЛекция №5 Организация ЭВМ и систем
Лекция №5 Организация ЭВМ и систем
pianist2317
 

Viewers also liked (17)

Лекция №10 Организация ЭВМ и систем
Лекция №10 Организация ЭВМ и системЛекция №10 Организация ЭВМ и систем
Лекция №10 Организация ЭВМ и систем
 
Лекция №14 Организация ЭВМ и систем
Лекция №14 Организация ЭВМ и системЛекция №14 Организация ЭВМ и систем
Лекция №14 Организация ЭВМ и систем
 
Лекция №12 Организация ЭВМ и систем
Лекция №12 Организация ЭВМ и системЛекция №12 Организация ЭВМ и систем
Лекция №12 Организация ЭВМ и систем
 
Лекция №8 Организация ЭВМ и систем
Лекция №8 Организация ЭВМ и системЛекция №8 Организация ЭВМ и систем
Лекция №8 Организация ЭВМ и систем
 
Лекция №13 Организация ЭВМ и систем
Лекция №13 Организация ЭВМ и системЛекция №13 Организация ЭВМ и систем
Лекция №13 Организация ЭВМ и систем
 
Actividades diarias
Actividades diariasActividades diarias
Actividades diarias
 
Лекция №11 Организация ЭВМ и систем
Лекция №11 Организация ЭВМ и системЛекция №11 Организация ЭВМ и систем
Лекция №11 Организация ЭВМ и систем
 
Лекция №4(часть 1) Организация ЭВМ и систем
Лекция №4(часть 1) Организация ЭВМ и системЛекция №4(часть 1) Организация ЭВМ и систем
Лекция №4(часть 1) Организация ЭВМ и систем
 
лекция 5 представление информации в эвм информатика
лекция 5 представление информации в эвм информатикалекция 5 представление информации в эвм информатика
лекция 5 представление информации в эвм информатика
 
Лекция № 2 Организация ЭВМ и систем
Лекция № 2 Организация ЭВМ и системЛекция № 2 Организация ЭВМ и систем
Лекция № 2 Организация ЭВМ и систем
 
лекция 6 представление информации в эвм информатика
лекция 6 представление информации в эвм информатикалекция 6 представление информации в эвм информатика
лекция 6 представление информации в эвм информатика
 
Лекция №5 Организация ЭВМ и систем
Лекция №5 Организация ЭВМ и системЛекция №5 Организация ЭВМ и систем
Лекция №5 Организация ЭВМ и систем
 
Лекция №1 Организация ЭВМ и систем
Лекция №1 Организация ЭВМ и системЛекция №1 Организация ЭВМ и систем
Лекция №1 Организация ЭВМ и систем
 
Лекция №4(часть 2) Организация ЭВМ и систем
Лекция №4(часть 2) Организация ЭВМ и системЛекция №4(часть 2) Организация ЭВМ и систем
Лекция №4(часть 2) Организация ЭВМ и систем
 
Лекция №15 Организация ЭВМ и систем
Лекция №15 Организация ЭВМ и системЛекция №15 Организация ЭВМ и систем
Лекция №15 Организация ЭВМ и систем
 
Лекция №5 Организация ЭВМ и систем
Лекция №5 Организация ЭВМ и системЛекция №5 Организация ЭВМ и систем
Лекция №5 Организация ЭВМ и систем
 
Лекция №4 Организация ЭВМ и систем (продолжение)
Лекция №4 Организация ЭВМ и систем (продолжение)Лекция №4 Организация ЭВМ и систем (продолжение)
Лекция №4 Организация ЭВМ и систем (продолжение)
 

Similar to Лекция №7 Организация ЭВМ и систем

025
025025
025
JIuc
 
40
4040
40
JIuc
 
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Kaspersky
 
Лекция 1. Архитектурно-ориентированная оптимизация программного обеспечения (...
Лекция 1. Архитектурно-ориентированная оптимизация программного обеспечения (...Лекция 1. Архитектурно-ориентированная оптимизация программного обеспечения (...
Лекция 1. Архитектурно-ориентированная оптимизация программного обеспечения (...
Mikhail Kurnosov
 
[JAM 2.1] RootKIT (Dmitry Kostenich)
[JAM 2.1] RootKIT (Dmitry Kostenich)[JAM 2.1] RootKIT (Dmitry Kostenich)
[JAM 2.1] RootKIT (Dmitry Kostenich)
jam_team
 

Similar to Лекция №7 Организация ЭВМ и систем (20)

prezlec_Історія.ppt
prezlec_Історія.pptprezlec_Історія.ppt
prezlec_Історія.ppt
 
025
025025
025
 
Обзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектурОбзор современных микроконтроллеров и их архитектур
Обзор современных микроконтроллеров и их архитектур
 
TMPA-2013 Smirnov
TMPA-2013 SmirnovTMPA-2013 Smirnov
TMPA-2013 Smirnov
 
Аппаратные и программные средства управления
Аппаратные и программные средства управленияАппаратные и программные средства управления
Аппаратные и программные средства управления
 
Аппаратные и программные средства управления
Аппаратные и программные средства управленияАппаратные и программные средства управления
Аппаратные и программные средства управления
 
40
4040
40
 
Процессоры и составляющие системного блока
Процессоры и составляющие системного блокаПроцессоры и составляющие системного блока
Процессоры и составляющие системного блока
 
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
Константин Трушкин. Использование платформы Эльбрус в информационно-защищённы...
 
01. Вводная лекция
01. Вводная лекция01. Вводная лекция
01. Вводная лекция
 
Процессор
ПроцессорПроцессор
Процессор
 
Platov
PlatovPlatov
Platov
 
Лекция 1. Архитектурно-ориентированная оптимизация программного обеспечения (...
Лекция 1. Архитектурно-ориентированная оптимизация программного обеспечения (...Лекция 1. Архитектурно-ориентированная оптимизация программного обеспечения (...
Лекция 1. Архитектурно-ориентированная оптимизация программного обеспечения (...
 
supercluster
superclustersupercluster
supercluster
 
TMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: GenodeTMPA-2013 Sartakov: Genode
TMPA-2013 Sartakov: Genode
 
Работа высоконагруженного DNS-сервера
Работа высоконагруженного DNS-сервераРабота высоконагруженного DNS-сервера
Работа высоконагруженного DNS-сервера
 
Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)
Лекция 4. Векторизация кода (Code vectorization: SSE, AVX)
 
Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)
Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)
Android Cloud... точнее Cloud из Android / Охрименко Алексей (Acronis)
 
[JAM 2.1] RootKIT (Dmitry Kostenich)
[JAM 2.1] RootKIT (Dmitry Kostenich)[JAM 2.1] RootKIT (Dmitry Kostenich)
[JAM 2.1] RootKIT (Dmitry Kostenich)
 
Caché Native Access. InterSystems Meetup 2014
Caché Native Access. InterSystems  Meetup 2014Caché Native Access. InterSystems  Meetup 2014
Caché Native Access. InterSystems Meetup 2014
 

Лекция №7 Организация ЭВМ и систем

  • 1. Организация ЭВМ и систем Тема: RISC – процессоры • Переход от CISC к чертам RISC архитектуры в семействе IA-32 • Основные черты RISC – процессоров • Характеристика современных RISC – процессоров, основные направления развития
  • 2. Экскурс в историюЭкскурс в историю В 70-е годы 19 века ученые выдвинули революционнуюВ 70-е годы 19 века ученые выдвинули революционную по тем временам идею создания микропроцессора,по тем временам идею создания микропроцессора, "понимающего" только минимально возможное количество"понимающего" только минимально возможное количество команд.команд. ЗамыселЗамысел RISCRISC - процессора (Reduced Instruction Set- процессора (Reduced Instruction Set Computer,Computer, компьютер с сокращенным набором командкомпьютер с сокращенным набором команд)) родился в результате практических исследований частотыродился в результате практических исследований частоты использования команд программистами, проведенных виспользования команд программистами, проведенных в 70-х годах в США и Англии. Их непосредственный итог -70-х годах в США и Англии. Их непосредственный итог - известноеизвестное ""правило 80/20правило 80/20": в 80% кода типичной": в 80% кода типичной прикладной программы используется лишь 20%прикладной программы используется лишь 20% простейших машинных команд из всего доступногопростейших машинных команд из всего доступного набора.набора.
  • 3. Определение RISC-процессора В действительности,В действительности, исходно аббревиатура RISCисходно аббревиатура RISC расшифровываласьрасшифровывалась несколько иначе, а именно какнесколько иначе, а именно как Rational Instruction Set Computer (RISC, компьютер сRational Instruction Set Computer (RISC, компьютер с рациональной системой командрациональной системой команд).). RISC-процессоры, таким образом противопоставлялисьRISC-процессоры, таким образом противопоставлялись процессорам с необязательно сложной (CISC - Complexпроцессорам с необязательно сложной (CISC - Complex Instruction Set Computer, компьютер со сложной системойInstruction Set Computer, компьютер со сложной системой команд), но "иррациональной", исторически сложившейсякоманд), но "иррациональной", исторически сложившейся архитектурой, в которой, в силу требований бинарной иархитектурой, в которой, в силу требований бинарной и ассемблерной совместимости с предыдущимиассемблерной совместимости с предыдущими поколениями, накоплено множество команд,поколениями, накоплено множество команд, специализированных регистров и концепций, в общем-то испециализированных регистров и концепций, в общем-то и не нужных, но вдруг отменишь команду двоично-не нужных, но вдруг отменишь команду двоично- десятичной коррекции, а какое-то распространенноедесятичной коррекции, а какое-то распространенное приложение "сломается"?приложение "сломается"?
  • 4. Первый "настоящий"Первый "настоящий" RISC-процессор с 31 командойRISC-процессор с 31 командой был создан под руководством Дэвида Паттерсона избыл создан под руководством Дэвида Паттерсона из Университета Беркли, затем последовалУниверситета Беркли, затем последовал процессорпроцессор сс наборомнабором изиз 39 команд39 команд. Они включали в себя 20 - 50 тыс.. Они включали в себя 20 - 50 тыс. транзисторов. Плодами трудов Паттерсонатранзисторов. Плодами трудов Паттерсона воспользовалась компания Sun Microsystems,воспользовалась компания Sun Microsystems, разработавшая архитектуру SPARC с 75 командами вразработавшая архитектуру SPARC с 75 командами в конце 70-х годов.конце 70-х годов. В 1981 г. в СтанфордскомВ 1981 г. в Станфордском университете стартовал проект MIPS по выпуску RISC-университете стартовал проект MIPS по выпуску RISC- процессора с 39 командами.процессора с 39 командами. В итоге была основанаВ итоге была основана корпорация Mips Computer в середине 80-х годов икорпорация Mips Computer в середине 80-х годов и сконструирован следующий процессор уже с 74сконструирован следующий процессор уже с 74 командами.командами. Примерно в то же время Intel разработала сериюПримерно в то же время Intel разработала серию 8038680386, последних "истинных" CISC-процессоров в, последних "истинных" CISC-процессоров в семействе х86.семействе х86. В последний раз повышениеВ последний раз повышение производительности было достигнуто только за счетпроизводительности было достигнуто только за счет усложнения архитектуры процессораусложнения архитектуры процессора: из 16-разрядной: из 16-разрядной она превратилась в 32-разрядную, дополнительныеона превратилась в 32-разрядную, дополнительные аппаратные компоненты поддерживали виртуальнуюаппаратные компоненты поддерживали виртуальную память и добавился целый ряд новых команд.память и добавился целый ряд новых команд.
  • 5. Основные особенности RISC -Основные особенности RISC - процессоровпроцессоров 1.1.Сокращенный набор командСокращенный набор команд (от 80 -150 команд).(от 80 -150 команд). 2.2.Большинство команд выполняется за 1 такт.Большинство команд выполняется за 1 такт. 3.3.Большое количество регистров общегоБольшое количество регистров общего назначения.назначения. 4.4.Наличие жестких многоступенчатых конвейеров.Наличие жестких многоступенчатых конвейеров. 5.5.Все команды имеют простой формат иВсе команды имеют простой формат и используются немногие способы адресации.используются немногие способы адресации. 6.6.Наличие вместительной раздельной кэш памяти.Наличие вместительной раздельной кэш памяти. 7.7.ПрименениеПрименение оптимизирующих компиляторовоптимизирующих компиляторов,, которые анализируют исходный код и частично меняюткоторые анализируют исходный код и частично меняют порядок следования команд.порядок следования команд.
  • 6. RISC – процессоры 3-го поколенияRISC – процессоры 3-го поколения 1.1.Ultra SPARC (ф. Sun Microsystem).Ultra SPARC (ф. Sun Microsystem). 2.2.PowerPC 620 (ф. IBM/Motorola).PowerPC 620 (ф. IBM/Motorola). 3.3.Alpha 21164 (ф. DEC).Alpha 21164 (ф. DEC). 4.4.R 10000 (ф. Mips Technology).R 10000 (ф. Mips Technology). 5.5.PA-8000 (ф. Hewlett Packard).PA-8000 (ф. Hewlett Packard). Самыми крупными разработчиками RISCСамыми крупными разработчиками RISC процессоров считаютсяпроцессоров считаются Sun MicrosystemsSun Microsystems (архитектура(архитектура SPARC),SPARC), IBMIBM (многокристальные процессоры Power,(многокристальные процессоры Power, однокристальные PowerPC), Digital Equipment (Alpha),однокристальные PowerPC), Digital Equipment (Alpha), Mips TechnologiesMips Technologies (семейство Rxx00), а также(семейство Rxx00), а также Hewlett-Hewlett- PackardPackard (архитектура PA-RISC).(архитектура PA-RISC). По данным независимой компании IDC за 1992 годПо данным независимой компании IDC за 1992 год архитектура SPARC занимала 56 % рынка, далееархитектура SPARC занимала 56 % рынка, далее следовали MIPS – 15 % и PA-RISC – 12.2 %.следовали MIPS – 15 % и PA-RISC – 12.2 %.
  • 7. Основные черты RISC –Основные черты RISC – процессоров 3-го поколенияпроцессоров 3-го поколения •ВсеВсе ЦП являются 64-х разрядными иЦП являются 64-х разрядными и суперскалярнымисуперскалярными (запускаются не менее 4-х команд за(запускаются не менее 4-х команд за такт).такт). •Встроенные конвейерные блоки арифметики сВстроенные конвейерные блоки арифметики с плавающей точкой.плавающей точкой. •Многоуровневая кэш память.Многоуровневая кэш память. Большинство RISCБольшинство RISC процессоров кэшируют предварительнопроцессоров кэшируют предварительно дешифрованные команды.дешифрованные команды. •ПрименяетсяПрименяется алгоритм динамического прогнози-алгоритм динамического прогнози- рования ветвленийрования ветвлений ии метод переназначения регистровметод переназначения регистров (позволяет реализовать внеочередное выполнение(позволяет реализовать внеочередное выполнение команд).команд). •Изготавливаются по КМОП технологии с 4-мя слоямиИзготавливаются по КМОП технологии с 4-мя слоями металлизации.металлизации.
  • 8. Повышение производительности RISC-Повышение производительности RISC- процессоров достигается:процессоров достигается: 1)1) за счет повышения тактовый частотыза счет повышения тактовый частоты,, 2)2) усложнения схемы кристаллаусложнения схемы кристалла.. Представителями первого направления являютсяПредставителями первого направления являются процессоры Alpha фирмы DECпроцессоры Alpha фирмы DEC (в 1995 году(в 1995 году переименована в Digital UNIX, после покупки DECпереименована в Digital UNIX, после покупки DEC компанией Compaq), наиболее сложными являютсякомпанией Compaq), наиболее сложными являются процессоры компании Hewlett-Packard.процессоры компании Hewlett-Packard.
  • 9. RISC-процессоры фирмы DEC.RISC-процессоры фирмы DEC. Структура процессора Alpha 21064Структура процессора Alpha 21064 (1992 г.)(1992 г.) BIU E-box IRF A-box Write Buffer D-cache I-box F-box FRF I-cache
  • 10. I-cache – кэш команд.I-cache – кэш команд. IRF – регистровый файл целочисленной арифметики.IRF – регистровый файл целочисленной арифметики. F-box – устройство арифметики с плавающей точкой.F-box – устройство арифметики с плавающей точкой. E-box – устройство целочисленной арифметики (7E-box – устройство целочисленной арифметики (7 ступеней конвейера).ступеней конвейера). I-box – командное устройство (управляет кэш команд,I-box – командное устройство (управляет кэш команд, выборка и дешифрация команд).выборка и дешифрация команд). A-box – устройство управления загрузкой/A-box – устройство управления загрузкой/ сохранением данных. Управляет процессом обменасохранением данных. Управляет процессом обмена данными между IRF, FRF, кэш данных и внешнейданными между IRF, FRF, кэш данных и внешней памятью.памятью. Write Buffer – буфер обратной записи.Write Buffer – буфер обратной записи. D-cache – кэш данных.D-cache – кэш данных. BIU – интерфейсный блок, с помощью которогоBIU – интерфейсный блок, с помощью которого подключаются внешняя кэш-память, размером 128 Кб - 8подключаются внешняя кэш-память, размером 128 Кб - 8 Мб.Мб.
  • 11. Процессор Alpha 21264Процессор Alpha 21264 (1998 г.)(1998 г.) Процессор Alpha 21264 отличается значительнойПроцессор Alpha 21264 отличается значительной новизной по сравнению с предшественником 21164. Онновизной по сравнению с предшественником 21164. Он обладает кэш-памятью первого уровня большего объема,обладает кэш-памятью первого уровня большего объема, дополнительными функциональными блоками, болеедополнительными функциональными блоками, более эффективными средствами предсказания ветвлений,эффективными средствами предсказания ветвлений, новыми инструкциями обработки видеоданных и широкойновыми инструкциями обработки видеоданных и широкой шиной.шиной. Alpha 21264 читает до четырех инструкций за одинAlpha 21264 читает до четырех инструкций за один такттакт и можети может одновременно исполнять до шестиодновременно исполнять до шести инструкцийинструкций. Самое большое его отличие от модели 21164. Самое большое его отличие от модели 21164 -- это способность выполнять командыэто способность выполнять команды (впервые для(впервые для Alpha)Alpha) с изменением их очередностис изменением их очередности (Out-of-Order).(Out-of-Order).
  • 12. Как и большинство RISC-процессоров, AlphaКак и большинство RISC-процессоров, Alpha содержитсодержит набор из 32 целочисленных и 32 регистров снабор из 32 целочисленных и 32 регистров с плавающей запятойплавающей запятой, все они имеют, все они имеют разрядность 64разрядность 64 битабита. Для повышения эффективности внеочередного. Для повышения эффективности внеочередного выполнения команд процессор 21264выполнения команд процессор 21264 дополнительнодополнительно кк обычному набору регистров снабженобычному набору регистров снабжен еще 48еще 48 целочисленными регистрами и 40 регистрами сцелочисленными регистрами и 40 регистрами с плавающей запятойплавающей запятой.. Каждый регистр может временно хранить значенияКаждый регистр может временно хранить значения текущих команд. Если обрабатывается какая-либотекущих команд. Если обрабатывается какая-либо инструкция, нет необходимости перегружать результат винструкция, нет необходимости перегружать результат в целевой регистр - вместо этого ЦП простоцелевой регистр - вместо этого ЦП просто переименовывает временный регистр (Register Renaming).переименовывает временный регистр (Register Renaming).
  • 13. ВВ 2126421264 реализована уникальная хитрость - онреализована уникальная хитрость - он имеетимеет задублированный набор целочисленных регистровзадублированный набор целочисленных регистров,, каждый из 80 целочисленных регистров дублируется ещекаждый из 80 целочисленных регистров дублируется еще раз. Таким образом, на чипе в целом -раз. Таким образом, на чипе в целом - 160160 целочисленных регистровцелочисленных регистров. Это одна из причин, почему,. Это одна из причин, почему, несмотря на сложность выполнения Out-of-Order,несмотря на сложность выполнения Out-of-Order, допустима высокая частота процессора 21264.допустима высокая частота процессора 21264. В процессора 21264 в отличие от его пред-В процессора 21264 в отличие от его пред- шественников практически полностью реорганизованашественников практически полностью реорганизована иерархия кэш-памяти. Он снабжен одним 64-Кбайт кэшемиерархия кэш-памяти. Он снабжен одним 64-Кбайт кэшем первого уровня (L1) для инструкций и еще одним 64-Кбайтпервого уровня (L1) для инструкций и еще одним 64-Кбайт кэшем первого уровня для данных; оба являютсякэшем первого уровня для данных; оба являются двукратно-ассоциативными. Кэш-память второго уровнядвукратно-ассоциативными. Кэш-память второго уровня (L2) была вынесена за пределы чипа - к ней можно(L2) была вынесена за пределы чипа - к ней можно обращаться через 128-бит backside-шину.обращаться через 128-бит backside-шину. [По материалам В.Михайлов,СomputerWeekly, 41_98 c.25][По материалам В.Михайлов,СomputerWeekly, 41_98 c.25]
  • 14. Сравнительные характеристикиСравнительные характеристики Alpha 21164 и 21264Alpha 21164 и 21264 CPUCPU 2116421164 2126421264 Тактовая частота, МГцТактовая частота, МГц 600600 600600 Кэш L1Кэш L1 Емкость:8(I)+8(D)Емкость:8(I)+8(D) Емкость: 64(I)+64(D)Емкость: 64(I)+64(D) Блокируется при числеБлокируется при числе непопаданий равномнепопаданий равном 22 88 Число ФИУЧисло ФИУ 44 66 Емкость файлаЕмкость файла 32(I)32(I) 80(I), 2 копии80(I), 2 копии РегистровРегистров 32(FP)32(FP) 72(FP)72(FP) Переименование регистровПереименование регистров нетнет дада Внеочередное выполнениеВнеочередное выполнение командкоманд нетнет дада ДинамическоеДинамическое предсказание переходовпредсказание переходов дада усовершенствованноеусовершенствованное Шина верхнего кэшаШина верхнего кэша системнаясистемная выделеннаявыделенная Поддержка мультимедиаПоддержка мультимедиа нетнет дада Число транзисторовЧисло транзисторов 9,3 млн9,3 млн 15,2 млн15,2 млн Площадь, ммПлощадь, мм22 298298 302302
  • 15. Первая версия,Первая версия, 2106421064 илиили EV4EV4, был первым КМОП, был первым КМОП микропроцессором, рабочая частота которого сделала егомикропроцессором, рабочая частота которого сделала его конкурентом миникомпьютерам и мейнфреймам,конкурентом миникомпьютерам и мейнфреймам, использовавшим гораздо более энергоёмкую элементнуюиспользовавшим гораздо более энергоёмкую элементную базу ЭСЛ. Второе поколение,базу ЭСЛ. Второе поколение, 2116421164 илиили EV5EV5, был первым, был первым микропроцессором, имевшим накристальный L2-кэшмикропроцессором, имевшим накристальный L2-кэш большого объёма. Процессорбольшого объёма. Процессор 2126421264 ((EV6EV6), был первым), был первым микропроцессором, совместившим в себе как высокуюмикропроцессором, совместившим в себе как высокую рабочую частоту, так и сложнуюрабочую частоту, так и сложную out-of-order executionout-of-order execution микроархитектуру.микроархитектуру. Выпуск процессоров архитектуры DEC Alpha былВыпуск процессоров архитектуры DEC Alpha был прекращён 27 октября 2007 года.прекращён 27 октября 2007 года. Процессор Alpha и заложенные в нём концепции прямоПроцессор Alpha и заложенные в нём концепции прямо или косвенно оказали влияние на конструкцию другихили косвенно оказали влияние на конструкцию других процессоров и на развитие отрасли в целом.процессоров и на развитие отрасли в целом.
  • 16. В оригинальном процессоре AMD AthlonВ оригинальном процессоре AMD Athlon использовалась шина, первоначально разработанная дляиспользовалась шина, первоначально разработанная для Alpha. В процессоре AMD Opteron применяетсяAlpha. В процессоре AMD Opteron применяется высокоскоростная межпроцессорная магистральвысокоскоростная межпроцессорная магистраль HyperTransport и встроенный контроллер памяти —HyperTransport и встроенный контроллер памяти — технологии, аналогичные тем, которые первымитехнологии, аналогичные тем, которые первыми предложили разработчики Alpha. Дирк Мейер, главныйпредложили разработчики Alpha. Дирк Мейер, главный инженер процессоров AMD, раньше работал над Alpha.инженер процессоров AMD, раньше работал над Alpha. Применяемая в серверных и настольных процессорахПрименяемая в серверных и настольных процессорах Intel технология HyperThreading, позволяющая процессоруIntel технология HyperThreading, позволяющая процессору решать несколько задач одновременно, навеянарешать несколько задач одновременно, навеяна исследованиями в области многопоточности,исследованиями в области многопоточности, проведёнными командой Alpha в DEC в 1990-е годы.проведёнными командой Alpha в DEC в 1990-е годы.
  • 17. Процессоры PA-RISCПроцессоры PA-RISC компании Hewlett-Packardкомпании Hewlett-Packard PA-RISC — микропроцессорная архитектура,PA-RISC — микропроцессорная архитектура, разработанная компанией Hewlett-Packard.разработанная компанией Hewlett-Packard. Первый RISC-процессор серии PA (PreciseПервый RISC-процессор серии PA (Precise Architecture), работавший на частоте 8 МГц, компания НРArchitecture), работавший на частоте 8 МГц, компания НР выпустила еще в 1985 году.выпустила еще в 1985 году. Процессор PA-8000 (1996 г.) вобрал в себя всеПроцессор PA-8000 (1996 г.) вобрал в себя все известные методы ускорения выполнения команд. В егоизвестные методы ускорения выполнения команд. В его основе лежитоснове лежит концепция "интеллектуальногоконцепция "интеллектуального выполнения",выполнения", котораякоторая базируется на принципебазируется на принципе внеочередного выполнения командвнеочередного выполнения команд..
  • 18. Процессоры PA-RISCПроцессоры PA-RISC компании Hewlett-Packardкомпании Hewlett-Packard Эти средства хорошо дополняют другие архитектурныеЭти средства хорошо дополняют другие архитектурные компоненты, заложенные в структуру кристалла:компоненты, заложенные в структуру кристалла:  большое число исполнительныхбольшое число исполнительных функциональных устройств;функциональных устройств;  средства прогнозирования направлениясредства прогнозирования направления переходов;переходов;  выполнения команд по предположению;выполнения команд по предположению;  оптимизированная организация кэш-памяти;оптимизированная организация кэш-памяти;  высокопроизводительный шинный интерфейсвысокопроизводительный шинный интерфейс..
  • 19. Высокая производительность PA-8000 во многомВысокая производительность PA-8000 во многом определяется наличием большого набораопределяется наличием большого набора функциональных устройств, который включает в себяфункциональных устройств, который включает в себя 1010 исполнительных устройствисполнительных устройств: два арифметико-логических: два арифметико-логических устройства (АЛУ) для выполнения целочисленныхустройства (АЛУ) для выполнения целочисленных операций, два устройства для выполнения операцийопераций, два устройства для выполнения операций сдвига/слияния данных, два устройства для выполнениясдвига/слияния данных, два устройства для выполнения умножения/сложения чисел с плавающей точкой, дваумножения/сложения чисел с плавающей точкой, два устройства деления/вычисления квадратного корня и дваустройства деления/вычисления квадратного корня и два устройства выполнения операций загрузки/записи.устройства выполнения операций загрузки/записи. Средства внеочередного выполнения командСредства внеочередного выполнения команд процессора PA-8000 обеспечивают аппаратноепроцессора PA-8000 обеспечивают аппаратное планирование загрузки конвейеров и лучшеепланирование загрузки конвейеров и лучшее использование функциональных устройств.использование функциональных устройств. В каждомВ каждом такте на выполнение могут выдаваться до четырехтакте на выполнение могут выдаваться до четырех командкоманд, которые поступают в 56-строчный буфер, которые поступают в 56-строчный буфер переупорядочивания.переупорядочивания.
  • 20. Кристалл может анализировать все 56 командныхКристалл может анализировать все 56 командных строк одновременно и выдавать в каждом такте по 4строк одновременно и выдавать в каждом такте по 4 готовых для выполнения команды в функциональныеготовых для выполнения команды в функциональные устройства. Это позволяет процессоруустройства. Это позволяет процессору автоматическиавтоматически выявлять параллелизм уровня выполнения командвыявлять параллелизм уровня выполнения команд.. Суперскалярный процессор PA-8000Суперскалярный процессор PA-8000 обеспечиваетобеспечивает полный набор средств выполнения 64-битовыхполный набор средств выполнения 64-битовых операций, включая адресную арифметику, а такжеопераций, включая адресную арифметику, а также арифметику с фиксированной и плавающей точкой. Приарифметику с фиксированной и плавающей точкой. При этом кристалл полностью сохраняет совместимость с 32-этом кристалл полностью сохраняет совместимость с 32- битовыми приложениями и с предыдущими и будущимибитовыми приложениями и с предыдущими и будущими реализациями PA-RISC. Этореализациями PA-RISC. Это первый процессор, впервый процессор, в котором реализована 64-битовая архитектура PA-котором реализована 64-битовая архитектура PA- RISCRISC..
  • 21.  PA-8200 (1997 г.) представляет собой суперскалярныйPA-8200 (1997 г.) представляет собой суперскалярный 64-битный RISC-процессор и реализует архитектуру64-битный RISC-процессор и реализует архитектуру PA-PA- RISC 2.0RISC 2.0. Существуют две версии этого процессора,. Существуют две версии этого процессора, работающие на частотах 200 и 240 MHz. При тактовойработающие на частотах 200 и 240 MHz. При тактовой частоте вчастоте в 240 MHz240 MHz процессор обеспечивает пиковуюпроцессор обеспечивает пиковую производительность впроизводительность в 960 MFLOPS960 MFLOPS, за счет, за счет одновременного исполнения 4 инструкцийодновременного исполнения 4 инструкций с плавающейс плавающей точкой.точкой.  Процессор PA-8200 включает следующие архитектурныеПроцессор PA-8200 включает следующие архитектурные особенности:особенности: Раздельные первичныеРаздельные первичные кэшикэши кода и данных, каждый покода и данных, каждый по 22 MBMB. Особенностью архитектуры PA-RISC является. Особенностью архитектуры PA-RISC является внекристальнаявнекристальная реализация кэша, что позволяетреализация кэша, что позволяет увеличивать его объем при необходимости. Кэш-памятьувеличивать его объем при необходимости. Кэш-память второго уровня не используется.второго уровня не используется.
  • 22.  10 независимых10 независимых функциональных устройствфункциональных устройств::  Два 64-разрядных целочисленных АЛУДва 64-разрядных целочисленных АЛУ  Два целочисленных устройства сдвигаДва целочисленных устройства сдвига  Два устройства умножения и сложения для чисел сДва устройства умножения и сложения для чисел с плавающей точкойплавающей точкой  Два устройства деления и извлечения корня дляДва устройства деления и извлечения корня для чисел с плавающей точкойчисел с плавающей точкой  Два устройства чтения/записи данныхДва устройства чтения/записи данных  БуферБуфер переупорядочения инструкцийпереупорядочения инструкций на 56 позиций;на 56 позиций; переупорядоченное выполнение инструкций позволяетпереупорядоченное выполнение инструкций позволяет постоянно поддерживать суперскалярный режим работыпостоянно поддерживать суперскалярный режим работы процессора. Устройство считывания инструкцийпроцессора. Устройство считывания инструкций доставляет в буфердоставляет в буфер 4 инструкции4 инструкции за такт.за такт.  УправляемаяУправляемая предвыборкапредвыборка данных из основной памятиданных из основной памяти в кэш.в кэш.
  • 23.  Статическое и динамическое предсказание ветвленийСтатическое и динамическое предсказание ветвлений  64-битная64-битная адресация памятиадресация памяти  Встроенная программируемая аппаратураВстроенная программируемая аппаратура мониторингамониторинга производительности; позволяет отслеживать такиепроизводительности; позволяет отслеживать такие события как кэш-попадания (промахи), ошибки всобытия как кэш-попадания (промахи), ошибки в предсказании ветвлений, и т.д.предсказании ветвлений, и т.д.
  • 24. 18 сентября 2001 года на рынок вышел процессор PA-18 сентября 2001 года на рынок вышел процессор PA- 8700. Данный чип стал первым решением НР,8700. Данный чип стал первым решением НР, использующим медные соединения и SOI-транзисторы.использующим медные соединения и SOI-транзисторы. Построенный с применением технологии 0,18 мк, онПостроенный с применением технологии 0,18 мк, он позволил достичь частоты 875 МГц.позволил достичь частоты 875 МГц. HP прекратила продажи машин HP 9000, основанныхHP прекратила продажи машин HP 9000, основанных на PA-RISC, в конце 2008 года. Поддержка серверов нана PA-RISC, в конце 2008 года. Поддержка серверов на процессорах PA-RISC была продолжена до 2013 года.процессорах PA-RISC была продолжена до 2013 года. Из HP в Intel перешли более 300 инженеровИз HP в Intel перешли более 300 инженеров работавших над Alpha, большинство из них работало надработавших над Alpha, большинство из них работало над процессором Itanium 2.процессором Itanium 2. Предполагалось, что новые машины, основанныеПредполагалось, что новые машины, основанные на Itanium, смогут заменить PA-RISC.на Itanium, смогут заменить PA-RISC. Itanium представляет собой совместный проект сItanium представляет собой совместный проект с Intel. При этом НР по праву считает ItaniumIntel. При этом НР по праву считает Itanium наследником PA-RISC.наследником PA-RISC.
  • 25. Пиковая производительность RISCПиковая производительность RISC – процессоров на конец XX века– процессоров на конец XX века МикропроцессорМикропроцессор Частота, МГцЧастота, МГц Производительность,Производительность, MFLOPSMFLOPS DEC Alpha 21164DEC Alpha 21164 700700 14001400 DEC Alpha 21264DEC Alpha 21264 800800 16001600 HP PA-8000HP PA-8000 180180 720720 HP PA-8200HP PA-8200 236236 944944 HP PA-8500HP PA-8500 400400 16001600 SGI/MIPS R10000SGI/MIPS R10000 250250 500500 SGI/MIPS R12000SGI/MIPS R12000 300300 600600 Sun UltraSPARC IISun UltraSPARC II 300300 600600 Sun UltraSPARC IIISun UltraSPARC III 600600 12001200
  • 26. Особенности процессоров сОсобенности процессоров с архитектурой SPARC компанииархитектурой SPARC компании Sun MicrosystemsSun Microsystems SPARC (Scalable Processor ARChitecture —SPARC (Scalable Processor ARChitecture — масштабируемая архитектура процессора) — архитектурамасштабируемая архитектура процессора) — архитектура RISC-микропроцессоров, первоначально разработанная вRISC-микропроцессоров, первоначально разработанная в 1985 году компанией Sun Microsystems.1985 году компанией Sun Microsystems. Архитектура SPARC является открытой, что означает:Архитектура SPARC является открытой, что означает: Архитектура системы команд SPARC опубликованаАрхитектура системы команд SPARC опубликована как стандарт IEEE 1754—1994;как стандарт IEEE 1754—1994; Спецификации SPARC доступны для лицензированияСпецификации SPARC доступны для лицензирования любой компанией или частным лицом и дают возможностьлюбой компанией или частным лицом и дают возможность разрабатывать свои собственные решения;разрабатывать свои собственные решения;  Развитием архитектуры SPARC занимаетсяРазвитием архитектуры SPARC занимается независимая некоммерческая организация SPARCнезависимая некоммерческая организация SPARC International, Inc., основанная в 1989 году. Членство вInternational, Inc., основанная в 1989 году. Членство в SPARC International открыто для всех желающих.SPARC International открыто для всех желающих.
  • 27. Для производства процессоров с архитектурой SPARCДля производства процессоров с архитектурой SPARC достаточно закупить у SPARC International, Inc. лицензиюдостаточно закупить у SPARC International, Inc. лицензию на архитектуру системы команд ($99) и разработать своюна архитектуру системы команд ($99) и разработать свою реализацию архитектуры, либо закупить готовуюреализацию архитектуры, либо закупить готовую реализацию (что несколько дороже).реализацию (что несколько дороже). Существовало 3 основные ревизии архитектурыСуществовало 3 основные ревизии архитектуры SPARC: версии 7, 8 и 9. Иногда UltraSPARC серии TSPARC: версии 7, 8 и 9. Иногда UltraSPARC серии T выделяются как отдельные архитектуры UltraSPARCвыделяются как отдельные архитектуры UltraSPARC Architecture 2005 и 2007.Architecture 2005 и 2007. Версия 8 архитектуры SPARC описывает 32-разрядныйВерсия 8 архитектуры SPARC описывает 32-разрядный микропроцессор, тогда как версия 9 — 64-разрядный.микропроцессор, тогда как версия 9 — 64-разрядный. Процессоры с архитектурой SPARC лицензированы иПроцессоры с архитектурой SPARC лицензированы и изготавливаются по спецификациям Sun несколькимиизготавливаются по спецификациям Sun несколькими производителями, среди которых следует отметитьпроизводителями, среди которых следует отметить компании Texas Instruments, Fujitsu, LSI Logic, Bipolarкомпании Texas Instruments, Fujitsu, LSI Logic, Bipolar International Technology, Philips и Cypress Semiconductor.International Technology, Philips и Cypress Semiconductor. В 1990 году Sun передала все права на архитектуруВ 1990 году Sun передала все права на архитектуру SPARC организации SPARC International,SPARC организации SPARC International, которая вкоторая в настоящее время включаетнастоящее время включает более 250 членов.более 250 членов.
  • 28. SuperSPARC (1992 г.)SuperSPARC (1992 г.) ДальнейшееДальнейшее увеличение производительностиувеличение производительности процессоров с архитектурой SPARC былопроцессоров с архитектурой SPARC было достигнуто за счетдостигнуто за счет реализации в кристаллах принципов суперскалярнойреализации в кристаллах принципов суперскалярной обработкиобработки компаниямикомпаниями Texas Instruments и Cypress.Texas Instruments и Cypress. Процессор SuperSPARC стал основой серии рабочих станций иПроцессор SuperSPARC стал основой серии рабочих станций и серверов SPARCstation/SPARCserver 10 исерверов SPARCstation/SPARCserver 10 и SPARCstation/SPARCserver 20. Имеется несколько версий этогоSPARCstation/SPARCserver 20. Имеется несколько версий этого процессора, позволяющего в зависимости от смеси командпроцессора, позволяющего в зависимости от смеси команд обрабатыватьобрабатывать до трех команд за один машинный тактдо трех команд за один машинный такт,, отличающихся тактовой частотой. Процессор имеетотличающихся тактовой частотой. Процессор имеет сбалансированную производительность на операциях ссбалансированную производительность на операциях с фиксированной и плавающей точкой,фиксированной и плавающей точкой, внутренний кэшвнутренний кэш емкостью 36 Кб (20 Кб - кэш команд и 16 Кб - кэш данныхемкостью 36 Кб (20 Кб - кэш команд и 16 Кб - кэш данных),), раздельные конвейеры целочисленной и вещественнойраздельные конвейеры целочисленной и вещественной арифметики и при тактовой частоте 75 МГц обеспечиваетарифметики и при тактовой частоте 75 МГц обеспечивает производительность около 205 MIPS.производительность около 205 MIPS. Процессор SuperSPARC применяется также в серверахПроцессор SuperSPARC применяется также в серверах SPARCserver 1000 и SPARCcenter 2000 компании Sun.SPARCserver 1000 и SPARCcenter 2000 компании Sun.
  • 29. hyperSPARC (1993 г.)hyperSPARC (1993 г.) Процессорный набор hyperSPARC с тактовой частотойПроцессорный набор hyperSPARC с тактовой частотой 100 МГц построен на основе технологического процесса100 МГц построен на основе технологического процесса КМОП с тремя уровнями металлизации и проектнымиКМОП с тремя уровнями металлизации и проектными нормами 0.5 микрон. Внутренняя логика работает снормами 0.5 микрон. Внутренняя логика работает с напряжением питания 3.3 В.напряжением питания 3.3 В. Процессор hyperSPARC реализован в видеПроцессор hyperSPARC реализован в виде многокристальной микросборкимногокристальной микросборки, в состав которой входит, в состав которой входит суперскалярная конвейерная часть и тесно связанная с нейсуперскалярная конвейерная часть и тесно связанная с ней кэш-память второго уровня. В набор кристаллов входяткэш-память второго уровня. В набор кристаллов входят RT620 (CPU) - центральный процессор, RT625 (CMTU) -RT620 (CPU) - центральный процессор, RT625 (CMTU) - контроллер кэш-памяти, устройство управления памятью иконтроллер кэш-памяти, устройство управления памятью и устройство тегов, четыре RT627 (CDU) - кэш-памятьустройство тегов, четыре RT627 (CDU) - кэш-память данных для реализации кэш-памяти второго уровняданных для реализации кэш-памяти второго уровня емкостью 256 Кбайт. RT625 обеспечивает также интерфейсемкостью 256 Кбайт. RT625 обеспечивает также интерфейс с MBus.с MBus.
  • 30.
  • 31. MicroSPARC-II (1994 г.)MicroSPARC-II (1994 г.) MicroSPARC-II представляет собойMicroSPARC-II представляет собой высокоинтегрированную микросхему, содержащуювысокоинтегрированную микросхему, содержащую целочисленное устройство, устройство управленияцелочисленное устройство, устройство управления памятью, устройство плавающей точки, раздельную кэш-памятью, устройство плавающей точки, раздельную кэш- память команд и данных, контроллер управленияпамять команд и данных, контроллер управления микросхемами динамической памяти и контроллер шинымикросхемами динамической памяти и контроллер шины SBus.SBus. Основными свойствами целочисленного устройстваОсновными свойствами целочисленного устройства microSPARC-II являются:microSPARC-II являются: пятиступенчатый конвейер команд;пятиступенчатый конвейер команд; предварительная обработка команд переходов;предварительная обработка команд переходов; поддержка потокового режима работы кэш-памятиподдержка потокового режима работы кэш-памяти команд и данных;команд и данных; регистровый файл емкостью 136 регистроврегистровый файл емкостью 136 регистров (8(8 регистровых окон);регистровых окон); интерфейс с устройством плавающей точки;интерфейс с устройством плавающей точки; предварительная выборка команд с очередью напредварительная выборка команд с очередью на четыре команды.четыре команды.
  • 32.
  • 33. В 2009 году компания Oracle купила компанию Sun.В 2009 году компания Oracle купила компанию Sun. Новые серверы линеек SPARC T5 и M5 работают подНовые серверы линеек SPARC T5 и M5 работают под управлением ОС Oracle Solaris. Они относятся к среднемууправлением ОС Oracle Solaris. Они относятся к среднему и верхнему сегменту производительности и предназначеныи верхнему сегменту производительности и предназначены для корпоративных приложений, интенсивно работающих сдля корпоративных приложений, интенсивно работающих с базами данных, а также критически важных бизнес-базами данных, а также критически важных бизнес- приложений.приложений. Основой серверов SPARC T5 стал одноименныйОсновой серверов SPARC T5 стал одноименный процессор, который Oracle называет самым быстрым впроцессор, который Oracle называет самым быстрым в мире микропроцессором.мире микропроцессором. Микропроцессор с 16 ядрамиМикропроцессор с 16 ядрами работает на частоте 3,6 ГГц,работает на частоте 3,6 ГГц, одновременно выполняя доодновременно выполняя до 128 потоков команд. В конфигурацию процессора входит 8128 потоков команд. В конфигурацию процессора входит 8 МБ совместно используемой кэш-памяти третьего уровня иМБ совместно используемой кэш-памяти третьего уровня и по 128 КБ кэш-памяти второго уровня в расчете на каждоепо 128 КБ кэш-памяти второго уровня в расчете на каждое ядро.ядро. Oracle SPARC T5-8 — самый быстрый одиночныйOracle SPARC T5-8 — самый быстрый одиночный сервер для Oracle Database и для Oracle Middleware. Посервер для Oracle Database и для Oracle Middleware. По соотношению цены и производительности он в 12 разсоотношению цены и производительности он в 12 раз превосходит сервер IBM Power 780.превосходит сервер IBM Power 780.
  • 34. Помимо SPARC T5-8, список новинок включает серверный модуль SPARC T5-1B, серверы SPARC T5-2, SPARC T5-4 и SPARC M5-32 (в ней используются шестиядерные процессоры T5).
  • 35. «Computerworld Россия», № 21, 2013«Computerworld Россия», № 21, 2013 Процессор SPARC M6 имеет 12 ядер — в два разаПроцессор SPARC M6 имеет 12 ядер — в два раза больше, чем у его предшественника SPARC M5. Каждоебольше, чем у его предшественника SPARC M5. Каждое ядро M6 способно одновременно выполнять 8 потоков.ядро M6 способно одновременно выполнять 8 потоков. Общее число потоков, одновременно обрабатываемыхОбщее число потоков, одновременно обрабатываемых чипом, может достигать 96.чипом, может достигать 96. Новые чипы могут устанавливаться в двух-, четырех- иНовые чипы могут устанавливаться в двух-, четырех- и восьмипроцессорные серверы, однако использованиевосьмипроцессорные серверы, однако использование специальных устройств Bixby позволит строить 32-, 48- испециальных устройств Bixby позволит строить 32-, 48- и даже 96-процессорные серверы с разделением памяти идаже 96-процессорные серверы с разделением памяти и других ресурсов. M6 призван сбалансироватьдругих ресурсов. M6 призван сбалансировать производительность серверов, уменьшить задержки ипроизводительность серверов, уменьшить задержки и обеспечить быструю обработку транзакций. Функцииобеспечить быструю обработку транзакций. Функции связности для больших систем разрабатывались с нуля исвязности для больших систем разрабатывались с нуля и могут применяться к небольшим серверным пулам.могут применяться к небольшим серверным пулам.
  • 36. «Computerworld Россия», № 21, 2013«Computerworld Россия», № 21, 2013 Компания Fujitsu анонсировала новейший 16-ядерныйКомпания Fujitsu анонсировала новейший 16-ядерный чип SPARC X+ для мэйнфреймов. Процессор работает начип SPARC X+ для мэйнфреймов. Процессор работает на частоте 3,5 ГГц и выше и может использоваться вчастоте 3,5 ГГц и выше и может использоваться в мэйнфреймах с 64-процессорной конфигурацией. Каждоемэйнфреймах с 64-процессорной конфигурацией. Каждое ядро одновременно обрабатывает два потока, в общей жеядро одновременно обрабатывает два потока, в общей же сложности мэйнфрейм способен параллельно выполнятьсложности мэйнфрейм способен параллельно выполнять 2048 потоков.2048 потоков.
  • 37. В ноябре 2002 года микропроцессоры SPARCВ ноябре 2002 года микропроцессоры SPARC использовались в 88 из 500 (17,60 %) самых мощныхиспользовались в 88 из 500 (17,60 %) самых мощных компьютеров, однако с тех пор потеряли популярность,компьютеров, однако с тех пор потеряли популярность, будучи заменены на процессоры от IBM, Intel и AMD.будучи заменены на процессоры от IBM, Intel и AMD. По состоянию на июль 2009 только одинПо состоянию на июль 2009 только один суперкомпьютер на процессорах SPARC включён в списоксуперкомпьютер на процессорах SPARC включён в список самых быстрых компьютеров TOP500. Находящийся на 28самых быстрых компьютеров TOP500. Находящийся на 28 месте суперкомпьютер Fujitsu FX1 используетместе суперкомпьютер Fujitsu FX1 использует четырёхядерные микропроцессоры SPARC64 VII 2,52 ГГц ичетырёхядерные микропроцессоры SPARC64 VII 2,52 ГГц и имеет производительность 121 282 GFLOPS. Онимеет производительность 121 282 GFLOPS. Он установлен в Японском агентстве аэрокосмическихустановлен в Японском агентстве аэрокосмических исследований.исследований. В 2011 году самым быстрым суперкомпьютером вВ 2011 году самым быстрым суперкомпьютером в рейтинге TOP500 признан «K computer» компании Fujitsuрейтинге TOP500 признан «K computer» компании Fujitsu он собран из 68 544 восьмиядерных процессоровон собран из 68 544 восьмиядерных процессоров SPARC64 VIIIfx и его мощность составляет 8,16 Пфлопс,SPARC64 VIIIfx и его мощность составляет 8,16 Пфлопс, пиковая 8,77 Пфлопс.пиковая 8,77 Пфлопс.
  • 38. Микропроцессоры архитектурыМикропроцессоры архитектуры SPARCSPARC лицензированылицензированы и изготавливаются по спецификациями изготавливаются по спецификациям SunSun несколькиминесколькими производителями, в том числе ЗАО «МЦСТ».производителями, в том числе ЗАО «МЦСТ». МЦСТ (закрытое акционерное общество (ЗАО) «МЦСТ») —МЦСТ (закрытое акционерное общество (ЗАО) «МЦСТ») — российская компания, специализирующаяся на разработкероссийская компания, специализирующаяся на разработке универсальных микропроцессоров, микроконтроллеров иуниверсальных микропроцессоров, микроконтроллеров и управляющих вычислительных комплексов. Имеет опыт разработкиуправляющих вычислительных комплексов. Имеет опыт разработки супер-ЭВМ «Эльбрус». Также в компании ведутся разработкисупер-ЭВМ «Эльбрус». Также в компании ведутся разработки оптимизирующих и двоичных компиляторов, операционных систем.оптимизирующих и двоичных компиляторов, операционных систем. ЗАО «МЦСТ» является базовой организацией кафедры информатики иЗАО «МЦСТ» является базовой организацией кафедры информатики и вычислительной техники Московского физико-технического институтавычислительной техники Московского физико-технического института (государственного университета).(государственного университета). Процессоры архитектурыПроцессоры архитектуры SPARC V8SPARC V8 (МЦСТ R150 и(МЦСТ R150 и МЦСТ R500) – первые продукты ЗАО «МЦСТ».) – первые продукты ЗАО «МЦСТ».
  • 39. Структура ядра микропроцессора МЦСТ R500 Кэш команд первого уровня (I$) – составляет 16 Кбайт. 2 регистровых файла: - регистровый файл целочисленных данных содержит 136 регистров по 32 бита (8 окон по 16 регистров и 1 окно из 8 глобальных регистров). - регистровый файл вещественных данных содержит 32 регистра 32-разрядных данных. При этом модуль может трактоваться в программах как набор из 32 регистров одинарного формата (разрядность 32 бита), либо как 16 регистров двойного формата (разрядность 64 бита), либо как смешанный набор регистров первого и второго вида.
  • 40. Процессоры ARMПроцессоры ARM ARM-процессоры – 32-битные чипы на базеARM-процессоры – 32-битные чипы на базе архитектуры RISC (Reduced Instruction Set Computer), тоархитектуры RISC (Reduced Instruction Set Computer), то есть с сокращённым набором команд. В основу этойесть с сокращённым набором команд. В основу этой архитектуры положена идея повышения быстродействияархитектуры положена идея повышения быстродействия за счёт максимального упрощения инструкций иза счёт максимального упрощения инструкций и ограничения их длины.ограничения их длины. Современные ARM-процессоры – это суперскалярныеСовременные ARM-процессоры – это суперскалярные суперконвейерные микросхемы, построенные на основесуперконвейерные микросхемы, построенные на основе RISC-архитектуры.RISC-архитектуры.
  • 41. На основе Cortex-A8На основе Cortex-A8 построен модныйпостроен модный планшет Apple iPad.планшет Apple iPad. Первые чипы на базеПервые чипы на базе Cortex-A9 – NVIDIACortex-A9 – NVIDIA Tegra 2 – этоTegra 2 – это двухъядерныедвухъядерные микросхемы смикросхемы с графическим ядром,графическим ядром, поддерживающимподдерживающим видео формата Fullвидео формата Full HD 1080p иHD 1080p и трёхмерную графикутрёхмерную графику с программнымс программным интерфейсом OpenGLинтерфейсом OpenGL ES 2.0.ES 2.0.
  • 42. Представлен процессорПредставлен процессор ARM Cortex-A17ARM Cortex-A17 11.02.2014г.11.02.2014г. По оценке разработчика, процессор ARM Cortex-A17 по производительно сти превосходит процессор ARM Cortex-A9 на 60%. Кроме того, он имеет лучшие показатели энергетической эффективности и использования площади кристалла. Источник: http://www.ixbt.com/news/hard/index.shtml?17/65/10
  • 43. Области примененияОбласти применения RISC - процессоровRISC - процессоров 1.1. Рабочие станции высшего ценового класса (12-15Рабочие станции высшего ценового класса (12-15 тыс.$). Работают под ОС VMS, Unix.тыс.$). Работают под ОС VMS, Unix. 2.2. Персональные рабочие станции (3-7 тыс. $). ОС:Персональные рабочие станции (3-7 тыс. $). ОС: Windows NT, Solaris.Windows NT, Solaris. 3.3. Серверы.Серверы. 4.4. RISC ПК.RISC ПК.
  • 44. Вопросы для самоконтроляВопросы для самоконтроля 1.1. С чем связано появление RISC-процессоров?С чем связано появление RISC-процессоров? 2.2. Основные особенности RISC-процессоров.Основные особенности RISC-процессоров. 3.3. Назовите фирмы-разработчики RISC процессоров.Назовите фирмы-разработчики RISC процессоров. 4.4. Архитектурные особенности процессоров Alpha.Архитектурные особенности процессоров Alpha. 5.5. Архитектурные особенности процессора PA-8000.Архитектурные особенности процессора PA-8000. 6.6. Области применения RISC-процессоров.Области применения RISC-процессоров.