第15回「インテル® Xeon® プロセッサー E5 ファミリー 新登場!」(2012/03/22 on しすなま!) Iintel様資料
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

第15回「インテル® Xeon® プロセッサー E5 ファミリー 新登場!」(2012/03/22 on しすなま!) Iintel様資料

on

  • 459 views

下記のしすなま!録画と併せてご覧ください。資料・録画の内容は生放送時点のものです。 ...

下記のしすなま!録画と併せてご覧ください。資料・録画の内容は生放送時点のものです。
第15回「インテル® Xeon® プロセッサー E5 ファミリー 新登場!」(2012/03/22)
<出演①> 中田 久史 様 インテル(株) インテル技術本部 プラットフォーム技術統括部 シニア・アプリケーション・エンジニア
<出演②> 飯塚 弘志 様 インテル(株) 営業本部 市場開発マネージャー
<出演③> 布施川 徹 日本アイ・ビー・エム(株) システムx事業部 製品企画・営業推進
http://www.ustream.tv/recorded/21277574

Statistics

Views

Total Views
459
Views on SlideShare
459
Embed Views
0

Actions

Likes
0
Downloads
0
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

第15回「インテル® Xeon® プロセッサー E5 ファミリー 新登場!」(2012/03/22 on しすなま!) Iintel様資料 Presentation Transcript

  • 1. Intel Confidential インテル® Xeon® プロセッサー E5 ファミリー 次世代データセンターの新基準 中田 久史 Regional Application Specialist, インテル株式会社 2012年3月22日
  • 2. Legal Disclaimers All products, computer systems, dates, and figures specified are preliminary based on current expectations, and are subject to change without notice. Intel processor numbers are not a measure of performance. Processor numbers differentiate features within each processor family, not across different processor families. Go to: http://www.intel.com/products/processor_number Intel, processors, chipsets, and desktop boards may contain design defects or errors known as errata, which may cause the product to deviate from published specifications. Current characterized errata are available on request. Intel® Virtualization Technology requires a computer system with an enabled Intel® processor, BIOS, virtual machine monitor (VMM). Functionality, performance or other benefits will vary depending on hardware and software configurations. Software applications may not be compatible with all operating systems. Consult your PC manufacturer. For more information, visit http://www.intel.com/go/virtualization No computer system can provide absolute security under all conditions. Intel® Trusted Execution Technology (Intel® TXT) requires a computer system with Intel® Virtualization Technology, an Intel TXT-enabled processor, chipset, BIOS, Authenticated Code Modules and an Intel TXT-compatible measured launched environment (MLE). Intel TXT also requires the system to contain a TPM v1.s. For more information, visit http://www.intel.com/technology/security Requires a system with Intel® Turbo Boost Technology. Intel Turbo Boost Technology and Intel Turbo Boost Technology 2.0 are only available on select Intel® processors. Consult your PC manufacturer. Performance varies depending on hardware, software, and system configuration. For more information, visit http://www.intel.com/go/turbo Intel® AES-NI requires a computer system with an AES-NI enabled processor, as well as non-Intel software to execute the instructions in the correct sequence. AES-NI is available on select Intel® processors. For availability, consult your reseller or system manufacturer. For more information, see http://software.intel.com/en-us/articles/intel-advanced-encryption-standard- instructions-aes-ni/ Intel, Intel Xeon, the Intel Xeon logo and the Intel logo are trademarks or registered trademarks of Intel Corporation or its subsidiaries in the United States and other countries. Other names and brands may be claimed as the property of others. Copyright © 2012, Intel Corporation. All rights reserved. 2
  • 3. Legal Disclaimers: Performance Performance tests and ratings are measured using specific computer systems and/or components and reflect the approximate performance of Intel products as measured by those tests. Any difference in system hardware or software design or configuration may affect actual performance. Buyers should consult other sources of information to evaluate the performance of systems or components they are considering purchasing. For more information on performance tests and on the performance of Intel products, Go to: http://www.intel.com/performance/resources/benchmark_limitations.htm. Intel does not control or audit the design or implementation of third party benchmarks or Web sites referenced in this document. Intel encourages all of its customers to visit the referenced Web sites or others where similar performance benchmarks are reported and confirm whether the referenced benchmarks are accurate and reflect performance of systems available for purchase. Relative performance is calculated by assigning a baseline value of 1.0 to one benchmark result, and then dividing the actual benchmark result for the baseline platform into each of the specific benchmark results of each of the other platforms, and assigning them a relative performance number that correlates with the performance improvements reported. SPEC, SPECint, SPECfp, SPECrate. SPECpower, SPECjAppServer, SPECjEnterprise, SPECjbb, SPECompM, SPECompL, and SPEC MPI are trademarks of the Standard Performance Evaluation Corporation. See http://www.spec.org for more information. TPC Benchmark is a trademark of the Transaction Processing Council. See http://www.tpc.org for more information. SAP and SAP NetWeaver are the registered trademarks of SAP AG in Germany and in several other countries. See http://www.sap.com/benchmark for more information. INFORMATION IN THIS DOCUMENT IS PROVIDED “AS IS”. NO LICENSE, EXPRESS OR IMPLIED, BY ESTOPPEL OR OTHERWISE, TO ANY INTELLECTUAL PROPERTY RIGHTS IS GRANTED BY THIS DOCUMENT. INTEL ASSUMES NO LIABILITY WHATSOEVER AND INTEL DISCLAIMS ANY EXPRESS OR IMPLIED WARRANTY, RELATING TO THIS INFORMATION INCLUDING LIABILITY OR WARRANTIES RELATING TO FITNESS FOR A PARTICULAR PURPOSE, MERCHANTABILITY, OR INFRINGEMENT OF ANY PATENT, COPYRIGHT OR OTHER INTELLECTUAL PROPERTY RIGHT. Performance tests and ratings are measured using specific computer systems and/or components and reflect the approximate performance of Intel products as measured by those tests. Any difference in system hardware or software design or configuration may affect actual performance. Buyers should consult other sources of information to evaluate the performance of systems or components they are considering purchasing. For more information on performance tests and on the performance of Intel products, reference www.intel.com/software/products. Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. 3
  • 4. 4 1. IDC “Server Workloads Forecast” 2009. 2.IDC “The Internet Reaches Late Adolescence” Dec 2009, extrapolation by Intel for 2015 2.Intel “Worldwide Device Estimates Year 2020 - Intel One Smart Network Work” forecast 3. Source: http://www.cisco.com/assets/cdc_content_elements/networking_solutions/service_provider/visual_networking_ip_traffic_chart.html extrapolated to 2015 ネットユーザが 10億人以上に ユーザーの増加1 150億台にのぼる ネットワーク接続機器 デバイスの増加2 1,000 エクサバイト を超えるインターネ ット・トラフィック データの増加3 ITに対する要求の急増は、性能、効率、コストの 最適な組み合わせを必要としています より多くの処理をより効率的に
  • 5. 5 同じ電力水準の前世代プロセッサーと比べて 最大 80%の性能向上1 インテル® アドバンスト・ベクトル・エクス テンションにより演算処理時間を大幅に削減 インテル® ターボ・ブースト・テクノロジー 2.0 により、必要に応じて性能を向上 インテル® データダイレクト I/O に対応した インテル® インテグレーテッド I/O により、 処理能力と帯域幅を拡大しながら レイテンシーを削減2 最大4本のメモリーチャネル DDR3-1600メモリーを サポート 最大8 コア 最大20 MB の キャッシュIntegrated PCI Express* 3.0 1ソケットあたり最大 40レーンまでサポート 次世代データセンターの中核 インテル® Xeon® プロセッサー E5-2600 製品ファミリー 1 Performance comparison using best submitted/published 2-socket server results on the SPECfp*_rate_base2006 benchmark as of 6 March 2012. 2 Source: Intel internal measurements of average time for an I/O device read to local system memory under idle conditions comparing Intel® Xeon® processor E5-2600 product family (230 ns) vs. Intel® Xeon® processor 5500 series (340 ns). See notes in backup for configuration details Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. For more information go to intel.com/performance
  • 6. 6 次世代データセンターのための機能強化 = E5-2600製品ファミリー の新機能 コア数の増加 メモリー容量の拡大 I/Oの統合 帯域幅の拡張 * Other names and brands may be claimed as the property of others PCIe* 3.0を 最大40レーン までサポート
  • 7. 新しいテクノロジーによるTCOの削減 インテル® バーチャライゼーション・テクノロジー 仮想化性能を向上させるプラットフォーム機能 インテル® ノード・マネージャー 2.0 消費電力の監視と上限設定によって 運用効率を最大化 インテル® データセンター・マネージャー データセンターの運用管理を支援 インテル® QuickPath インターコネクト 最大 3.5 倍の帯域幅を提供し プロセッサー間の帯域幅を拡大 統合パワーゲート アイドル状態のコアの消費電力を ゼロに近づける機能 インテル® ターボ・ブースト・テクノロジー 2.0 動作周波数を引き上げ処理負荷の急増に対応 インテル® AES-NI 暗号化処理を最大 10 倍に高速化 インテル® トラステッド・エグゼキューション・テクノロジー 起動前に改ざんを検知 インテル® アドバンスト・ベクトル・エクステンション 1 クロックあたりの FLOPS を最大 2 倍に向上 インテル® インテグレーテッド I/O I/O レイテンシーを最大 30%削減 インテル® ハイパー・スレッディング・テクノロジー コアあたりのスレッド数を倍増 2007年以来の大幅な技術革新 7
  • 8. Higher is better 8 前世代に比べて最大80%の性能向上 1 1.51 1.59 1.62 1.83 1.88 2.18 Intel® Xeon® Processor E5-2690 (8C, 2.9 GHz) Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. Linpack performance may vary based on thermal solution. Source: Intel internal measurements and best published results as of 6 March 2012 For more information go to http://www.intel.com/performance X5690 Baseline (3.46GHz, 6C) SPECvirt_sc*2011 SPECint*_rate _base2006 SPECjbb*2005 SPECfp*_rate _base2006 STREAM_MP Triad Linpack Intel® Xeon® Processor E5-2690 (8C, 2.9GHz, 135W) vs. Intel® Xeon® Processor X5690 (6C, 3.46GHz, 130W)
  • 9. チック・タック開発モデル: Sustained Microprocessor Leadership Intel® Core™ Microarchitecture TOCK New Micro- architecture Merom 65nm TICK Penryn New Process Technology 45nm Intel® Microarchitecture Codename Nehalem TOCK New Micro- architecture Nehalem 45nm TICK Westmere 32nm New Process Technology Intel® Microarchitecture Codename Sandy Bridge TOCK Sandy Bridge 32nm New Micro- architecture TICK Ivy Bridge 22nm New Process Technology Intel® Microarchitecture Codename Haswell TOCK Haswell 22nm New Micro- architecture TICK Future 14nm New Process Technology 9
  • 10. Sandy Bridgeコアのフロントエンドの改良 Totally new branch predictor • Excellent Performance and Power/Performance Decoded Uop Cache • Power down front end and use cached results of decoding • Improves performance by decreasing front end latency • Improve performance by ‘stitching’ together code across branches • Sustain higher uop Bandwidth by “do once” handling of X86 complexities Lower Power AND Higher Performance 32K ICache PreDecode Instruction Queue Decode PreDecode Instruction Queue Decode uop Queue Out of Order Execution uop Queue Out of Order Execution Uop Cache Hit Logic Uop Cache Hit Logic Uop Cache Data Uop Cache Data Branch Prediction Branch Prediction Branch Prediction Branch Prediction 32K Instruction Cache Sandy Bridge - Intel® Next Generation Microarchitecture10
  • 11. Make the memory ports symmetric • Two 128-bit loads per cycle • Second load port is fully featured for misalignment and store forwarding • Increased store address BW 48 bytes per cycle internal memory bandwidth Load Store (address) Store (data) 32K Data Cache 256K Mid-Level Cache Store Buffer and Forwarding Scheduler 2 loads per cycle increases performance for many applications Load Store (address) Load Store (address) 32K Data Cache 8-byte banks Store Buffer and Forwarding Sandy Bridge - Intel® Next Generation Microarchitecture Sandy Bridgeコアのメモリクラスタの改良 11
  • 12. 12 インテル® アドバンスト・ベクトル・エクステンション • Intel® AVX extends all 16 XMM registers to 256bits • Intel AVX works on either • The whole 256-bits – for FP instructions • The lower 128-bits (like existing SSE instructions) • A drop-in replacement for all existing scalar/128-bit SSE instructions • The upper part of the register is zeroed out • Intel AVX targets high-performance • 256-bit Multiply, Add and Shuffle engines • 2nd load port 256 bits (upcoming) YMM0 XMM0 128 bits (1999)
  • 13. 「バスタブ」モデル: Flow from the faucet… (CPU power) can exceed drain flow… (thermal solution capability) for a short time… (depending on capacity, level and flow) if the bathtub… (energy or temperature) is not full. (at limits) Turbo 2.0 Implications: CPU can safely operate >TDP for short periods Potential for more time in Turbo mode, especially when system has been operating at low power インテル® ターボ・ブースト・テクノロジー 2.0 パワーバジェットの概念 Thermal solution “drains” energy from the system CPU adds energy to the system Temperature orEnergy Thermal Budget Thermal Capacitance 13 パワーバジェット管理によって、ヘッドルームがある場合は バースト的な電力消費が可能になり、最大限のパフォーマンスを発揮
  • 14. インテル® ターボ・ブースト・テクノロジー 2.0 の動作例 Time Power Sleep or Low power “Next Gen Turbo Boost” “TDP” C0 (Turbo) After idle periods, the system accumulates “energy budget” and can accommodate high power/performance for a few seconds In Steady State conditions the power stabilizes on TDP Buildup thermal budget during idle periods Use accumulated energy budget to enhance user experience 14
  • 15. 性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行ったもの です。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と組み合わせた場合の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。 1 出典: I/O デバイスからアイドル状態のローカル・システム・メモリーにデータを読み込む処理の平均所要時間をインテル社内で測定し、インテル® Xeon® プロセッサー E5-2600 製品ファミリー (230 ns) とインテル® Xeon® プロセッサー 5500 番台 (340 ns) を比較。 2 出典: www.Pcisig.Com/news_room/november_18_2010_press_release/ (英語) 3 「I/O パフォーマンスが最大 2.3 倍」は、 8 つの 10GbE ポートを使用した L2 フォワーディング・テストで Xeon® プロセッサー 5600 番台搭載 1-way サーバーと Xeon® プロセッサー E5-2600 搭載 1-way サーバーを比較した結果に基づきます。 インテル® インテグレーテッド I/O によるデータ転送の高速化 インテル® インテグレーテッド I/O インテル® インテグレー テッド I/O レイテンシーを最大 30% 削減1 PCI Express* 3.0 2 倍の帯域幅2 インテル® データ ダイレクト I/O 2 倍以上高速3 10 Gb イーサネット 最大 10 倍の帯域幅 インテル® インテグレーテッド I/O とは 15
  • 16. インテル® Xeon® プロセッサー E5 ファミリー の電力効率 データセンターにおける最高の消費電力当たり性能を実現1 約 70%1 同じ消費電力でパフォーマンスが向上 X5690 (3.46GHz, 6C, 130W) Scale memory, cache, & I/O to match core needs Fine grained control across 23 power domains Improved efficiency reduces operating expenses 16 E5-2680 (2.7GHz, 8C, 130W) 性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、特定のコ ンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行ったものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と組み合わせた場合 の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。 1 出典:同じTDPでSPECfp*_rate_base2006ベンチマークを使用して行ったパフォーマンスの比較。ベースラインとなるスコア271は、http://www.spec.org/( 英語)に掲載された、インテル® コンパイ ラー 12.1 を使用して行った2012 年1 月17 日現在の最良の公表値に基づく、前世代の2-way インテル® Xeon® プロセッサー X5690 の数値です。詳細については、http://www.spec.org/cpu2006/results/ res2012q1/ cpu2006-20111219-19195.html( 英語) を参照してください。新しいスコア466は、2 基のインテル® Xeon® プロセッサー E5-2680、ターボ有効、EIST 有効、ハイパースレッディング使用、 64 GB RAM、インテル® コンパイラー 12.1、THP 無効、Red Hat* Enterprise Linux* Server 6.1 を搭載したインテル® Rose City プラットフォームを使用してインテル社内で測定した推定値に基づきます。 SPECfp*_rate_base2006 271 466
  • 17. Virtualization, in-memory databases and high performance computing are driving need for more memory LRDIMM enables up to 3x more capacity compared to RDIMM Intel Xeon processor E5-2600 family based platforms w/ LRDIMMs have max capacity of 768 GB メモリサポートの拡張 - LRDIMMの特徴 0 128 256 384 512 640 768 1066 1333 32 GB LRDIMM 32 GB RDIMM 16GB RDIMM Memory Controller Data Data Memory Controller Data Data ........ .......... Register .......... ........ .......... Buffer .......... CMD/ADDR/ CLK CMD/ ADDR/ CLK Higher loading on data drivers Reduced loading on data drivers RDIMM LRDIMM 17
  • 18. 18 インテル® ノード・マネージャー および インテル® データセンター・マネージャー・ ソフトウェアによる効率的な消費電力管理 上限設定 ノードの最大消費 電力を設定し、安 心してラック密度 を向上 監視 実際の消費電力を サーバーから直接 監視 最適化 データと消費電力の 上限設定を活用し、 最大の効率が得られ るようにワークロー ドを最適化 継続性 電力障害時には自 動的に消費電力を 削減し、運用を継 続
  • 19. 電力効率化のための4つの柱: Knowledge and Control is Power! Energy Efficient……… Performance: • Intel® Turbo Boost Technology 2.0 Data Center: • Running Average Power Limit Software: • Intel® Node Manager 2.0 Platform: • Improved Load line Monitor Server Power Consumption Provision Power Budget to avoid Performance Loss Improve Density by setting Power Limits Monitor for Performance Effects 19
  • 20. インテル® テクノロジー: サーバーのセキュリティー 強化 インテル® TXTは、「 信頼できる」実行環境 を保証、セキュリティ ー・ポリシーに基づい た管理の移行を可能に 暗号化 インテル® AES-NI は、暗号化処理を 高速化し、データ 保護を強化 分離 インテル® VT とイ ンテル® TXTにより プラットフォーム の安全な起動を実 現、VMごとに分離 し保護 VM Intel® TXT Platform ??? VM VM Intel® TXT Platform VMVM 20 Intel® Trusted execution Technology Intel® AES New Instruction
  • 21. 数々のベンチマークで新記録を樹立 E5-2600 は x86 プロセッサー搭載 2 ソケット・サーバーで 15 の新記録を樹立 性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システ ム、コンポーネント、ソフトウェア、操作、機能に基づいて行ったものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と組み合わせた場合の本製品の性能など、ほかの情報や性能テストも 参考にして、パフォーマンスを総合的に評価することをお勧めします。 SPECvirt_sc*2010 高性能コンピューティング VMmark* 2 SPECapc* for 3ds Max* 2011 仮想化環境 エンタープライズ基盤 Web SAP-SD* 2-Tier, TPC* Benchmark E SPECjbb*2005 SPECpower*_ssj2008, SAP* Server Power 2-Tier SPECjEnterprise*2010 SPECompL*_base2001 参考:http://www.intel.com/content/www/us/en/benchmarks/server/xeon-e5-2600-summary.html 21