SlideShare a Scribd company logo
1 of 10
3rd ACM Symposium on Cloud
Computing (SoCC2012) 報告
  独立行政法人産業技術総合研究所
     情報技術研究部門
       小川 宏高

              2012/11/30 第36回グリッド協議会 資料
SoCC12概要
•   3rd ACM Symposium on Cloud Computing
     –   October 14th-17th, 2012 – San Jose, CA
     –   http://www.socc2012.org/
     –   第1回はSIGMOD、第2回はSOSPと併設→今年から独立
     –   25 papers (21 full-length papers) / 163 submissions≒15.3%
     –   評価がしっかりしている論文が多い
•   クラウド化・ソーシャル化
     –   ホームページ → Google Sites
     –   Proceedings → Dropbox
           •   おかげでプログラムが2週間前にしか確定しない→旅程が立てづらい
     –   コンファレンスバッグ→当然省略
     –   座席は円卓
           •   スクール形式に変更するとコストアップ
           •   円卓なので自然に隣の人と話す
     –   Twitter
                                                                          Day 1
•   Keynote                                                                       Keynote


     –   Software-Defined Networking: Overview and Implications,          Day 2
         Scott Shenker (UCB)                                              Day 3             Tutorial
     –   http://www.slideshare.net/martin_casado/sdn-abstractions とほぼ同じ
•   Tutorial
     –   Designing Good Algorithms for Map-Reduce and Beyond
           •   計算と通信のバランス、Reducer skewのマネジメント
     –   Open Source Cloud Technologies
           •   OpenStack, CloudStack
Day 1


                                  Day 1 (1/3)                                               Day 2
                                                                                            Day 3         Tutorial




•   Goal-Oriented Resource Management
    – Cake: Enabling High-level SLOs on Shared Storage Systems
         •   Andrew Wang (UCB), Shivaram Venkataraman (UCB), Sara Alspaugh (UCB), Randy Katz (UCB), and
             Ion Stoica (UCB)
         •   多数のバッチジョブ、インタラクティブジョブが混在するクラウド環境でSLOを満たすリ
             ソーススケジューリングを実現 (2-level scheduling)
         •   1st: ラージジョブのチャンキング、2nd: SLOを満たすようにリソース割り当て
    – Bridging the Tenant-Provider Gap in Cloud Services
         •   Virajith Jalaparti (UIUC), Hitesh Ballani (MSR), Paolo Costa (Imperial College London), Thomas
             Karagiannis (MSR), and Ant Rowstron (MSR)
         •   Bazzar: ジョブスペックと完了時間を与えるとリソースタプルを返すスケジューラ (ジョブセ
             ントリックインタフェース)
         •   MRCuTE: Bazzarの性能予測エンジン、MRジョブのジョブスペックとリソースタプルを与え
             ると予測完了時刻を返すMRアプリ
    – Generalizing Resource Allocation for the Cloud
         •   Anshul Rai (MSR India), Ranjita Bhagwan (MSR India), and Saikat Guha (MSR India)
         •   Wrasse: クラウド向けリソース割り当てツール(サービス)
         •   「Balls and Bins問題を記述したプログラム」としてリソース要求を記述、GPUソルバーで高
             速計算
    – True Elasticity in Multi-Tenant Clusters through Amoeba (**)
         •   Ganesh Anantharanayanan (UCB), Christopher Douglas (Microsoft), Raghu Ramakrishnan (Microsoft),
             Sriram Rao (Microsoft), and Ion Stoica (UCB)
         •   Hadoopでは、MRジョブを耐障害性を持つ複数のタスクに分割して実行→リソースの利用効
             率と性能の両立が難しい (elasticではない?)
         •   Amoebaでは、checkpoint&restartによるプリエンプションを実現し、その上でMRを実行
Day 1


                                   Day 1 (2/3)                                             Day 2
                                                                                           Day 3          Tutorial




•   Big Data Processing
     – Improving Large Graph Processing on Partitioned Graphs in the Cloud
          •   Rishan Chen (Beijing U.), Xuetian Weng (Beijing U.), Bingsheng He (Nanyang Technological U.), Mao
              Yang (MSRA), Byron Choi (Hong Kong Baptist U.), and Xiaoming Li (Beijing U.)
     – Sailfish: A Framework For Large Scale Data Processing
          •   Sriram Rao (Microsoft), Raghu Ramakrishnan (Microsoft), Adam Silberstein (LinkedIn), Mike
              Ovsiannikov (Quantcast), and Damian Reeves (Quantcast)
          •   Sailfish: MR処理系の律速要因である中間データの入出力を最適化
          •   中間データの交換をI-fileと呼ばれる一種の分散ファイル抽象を介して行うことでバッチI/Oを
              実現
          •   MRの性質からアペンドに特化したlock-free atomic writeのみをサポート
          •   Hadoop MRv2にプラガブルな実装
     – Themis: An I/O Efficient MapReduce
          •   Alexander Rasmussen (UCSD), Michael Conley (UCSD), Rishi Kapoor (UCSD), Vinh The Lam
              (UCSD), George Porter (UCSD), and Amin Vahdat (UCSD)
          •   Themis: MRジョブの多くはI/O律速→I/O操作が最小の実装を目指すもの
          •   タスクレベルの耐故障性機能の除去 (フェイルしたら全体を再実行)
          •   中間データのディスクスピルを抑制するためにアプリケーションレベルで動的かつ適用的な
              メモリ割り当てを実現
          •   シャッフルおよびディスクI/Oの集中管理 (ディスクシークを減らすために複数Mapタスクか
              らの書き込みをバッファリングしてバッチ書き込みするなど)
Day 1


                                  Day 1 (3/3)                                               Day 2
                                                                                            Day 3         Tutorial




•   Cloudy Workloads & Management
    – Heterogeneity and Dynamicity of Clouds at Scale: Google Trace Analysis
         •   Charles Reiss (UCB), Alexey Tumanov (CMU), Gregory R. Ganger (CMU), Randy H. Katz (UCB), and
             Michael A. Kozuch (Intel Labs)
         •   Googleクラスタのトレースデータの分析
         •   リソースの不均一性(cores:RAM)、タスクの不均一性(実行時間、要求リソース量)
             →リソースのスロットをタスクに割り当てるスケジューラは不向き
         •   タスクのリソース利用量は動的に大きく変動
             →効率良くリソース割り当てするには高速なスケジューリングが肝要
    – More for Your Money: Exploiting Performance Heterogeneity in Public Clouds
         •   Benjamin Farley (U. of Wisconsin-Madison), Venkatanathan Varadarajan (U. of Wisconsin-Madison), Kevin
             Bowers (RSA Laboratories), Ari Juels (RSA Laboratories), Thomas Ristenpart (U. of Wisconsin-Madison),
             and Michael Swift (U. of Wisconsin-Madison)
         •   同一料金で提供されているAmazon EC2インスタンスでも性能差がある(CPU, Network, Local disk,
             EBS)
         •   Placement Gaming: maximize work/$
         •   オフラインのプロファイリング結果とオンラインの性能計測結果を用いる戦略
    – Untangling Cluster Management With Helix
         •   Kishore Gopalakrishna (LinkedIn), Shi Lu (LinkedIn), Zhen Zhang (LinkedIn), Adam Silberstein (LinkedIn),
             Kapil Surlaker (LinkedIn), Ramesh Subramonian (LinkedIn), Bob Schulman (LinkedIn)
         •   Helix: LinkedInで開発・採用しているオープンソースのクラスタ管理システム
         •   KVS (Espresso)、Messaging (Kafka)、Notification (Databus)、Indexing Service (SeaS)、分散グラ
             フ処理エンジンなどに統一的にリソース管理、耐故障性、Elasticity, Monitoringを実現する
             (c.f.,YARN, Mesos)
    – alsched: Algebraic Scheduling of Mixed Workloads in Heterogeneous Clouds
         •   Alexey Tumanov (CMU), James Cipar (CMU), Michael A. Kozuch (Intel Labs), and Gregory R. Ganger
             (CMU)
Day 1


                                     Day 2 (1/4)                                            Day 2
                                                                                            Day 3          Tutorial




•   I/O Performance
     – Using Vector Interfaces to Deliver Millions of IOPS from a Networked Key-value
       Storage Server
          •   Vijay Vasudevan (CMU), Michael Kaminsky (Intel Labs), and David G. Andersen (CMU)
          •   PCIe SSDをベースにした既存KVS実装ではSWインタフェースで直列化され性能が出ない
          •   ベクターRPC IF
                 –   multiple get requests → single multiget request
          •   ベクターストレージIF
                 –   並列ファイルシステムのPOSIX HPC拡張 readx()/writex() に類似
                 –   複数のバッファ、ファイルディスクリプタを指定して並列読み書きを実現
          •   1.6Mreq/sec、1msec latencyを実現 (14倍以上高速化)
     – vBalance: Using Interrupt Load Balance to Improve I/O Performance for SMP Virtual
       Machines
          •   Luwei Cheng (U. of Hong Kong) and Cho-Li Wang (U. of Hong Kong)
          •   UP VMだとハードウェア割込を受け取る仮想CPUが確定するが、複数の仮想CPUからなる
              SMP VMではプリエンプトしている仮想CPUへの割込が発生するとディレイが大きい
          •   プリエンプトしていない動作中の仮想CPUに割り当てることでI/O性能を向上
     – Romano: Autonomous Storage Management using Performance Prediction in Multi-
       Tenant Datacenters
          •   Nohhyun Park (U. of Minnesota), Irfan Ahmad (CloudPhysics), and David J. Lilja (U. of Minnesota)
Day 1


                          Day 2 (2/4)                                   Day 2
                                                                        Day 3      Tutorial




• Data Consistency
   – All Aboard the Databus! LinkedIn's Scalable Consistent Change
     Data Capture Platform
      • Shirshanka Das (LinkedIn), Chavdar Botev (LinkedIn), Kapil Surlaker (LinkedIn),
        Bhaskar Ghosh (LinkedIn), Balaji Varadarajan (LinkedIn), Sunil Nagaraj
        (LinkedIn), David Zhang (LinkedIn), Lei Gao (LinkedIn), Jemiah Westerman
        (LinkedIn), Phanindra Ganti (LinkedIn), Boris Shkolnik (LinkedIn), Sajid Topiwala
        (LinkedIn), Alexander Pachev (LinkedIn), Naveen Somasundaram (LinkedIn) and
        Subbu Subramaniam (LinkedIn)
      • LinkedInで使われている更新通知フレームワーク
   – Logic and Lattices for Distributed Programming
      • Neil Conway (UCB), William R. Marczak (UCB), Peter Alvaro (UCB), Joseph M.
        Hellerstein (UCB), and David Maier (Portland State U.)
   – How Consistent is your Cloud Application?
      • Kamal Zellag (McGill U.) and Bettina Kemme (McGill U.)
   – The Potential Dangers of Causal Consistency and an Explicit
     Solution (**)
      • Peter Bailis (UCB), Alan Fekete (U. of Sydney), Ali Ghodsi (UCB), Joseph M.
        Hellerstein (UCB), and Ion Stoica (UCB)
Day 1


                                   Day 2 (3/4)                                            Day 2
                                                                                          Day 3     Tutorial




•   Load Balancing and Scheduling
     – Balancing Reducer Skew in MapReduce Workloads using Progressive Sampling
          •   Smriti R Ramakrishnan (Oracle), Garret Swart (Oracle), and Aleksey Urmanov (Oracle)
          •   Reducer Skew: 中間キーのReducerへの割り当ての偏り→Reducerが律速に
          •   実行時サンプリングデータを元に中間キーの割り当てを平準化
                 –   頻度の高い中間キーはサブキーに分割して割り当て (Key Chopping)
                 –   頻度が平均的な中間キーは負荷が平均化するように割り当て (Key Packing = greedy bin packing)
          •   Oracle Loader for Hadoop (Hadoopの最終出力をOracle DBに高速書き込み) で使われている
     – Zeta: Scheduling Interactive Services with Partial Execution (タイトル変更)
          •   Yuxiong He (MSR), Sameh Elnikety (MSR), James Larus (MSR), and Chenyu Yan (Microsoft Bing)
          •   インタラクティブサービス(検索エンジン、金融サービス等)のように時間制約の強いスケジュー
              リング
          •   時間がかかるジョブは途中で実行を止めて結果を返す→他のジョブの割り当て遅延を避ける、プ
              リエンプションのコストを避ける
          •   Bingのバックエンドに組み込んだ実験で検索品質を保ちながらリソースを20%強削減
     – Chronos: Predictable Low Latency for Data Center Applications
          •   Rishi Kapoor (UCSD), George Porter (UCSD), Malveeka Tewari (UCSD), Geoffrey M. Voelker (UCSD),
              and Amin Vahdat (UCSD)
          •   データセンタアプリでは、サービス時間の予測可能性と制御されたレイテンシ(テイルレイテン
              シ)が重要
          •   カーネルでの遅延要因(割込ハンドリング、バッファ管理、ネットワークスタック、データコピー
              等々)の除去
              →ユーザレベル通信APIを提供
          •   ユーザアプリスレッド間でのロック競合の解決をNICにオフロード
              →パケットにパーティションIDを付番、NIC上でパーティションIDのハッシュ値を計算してCPU
              スレッドにマッピング
Day 1


                                    Day 2 (4/4)                                               Day 2
                                                                                              Day 3          Tutorial




•   Cloudy Pot Pourri
     – Using Batteries to Reduce the Power Costs of Internet-scale Distributed Networks
          •   Darshan S. Palasamudram (Penn. State U.), Ramesh K. Sitaraman (UMass, Amherst & Akamai
              Tech.), Bhuvan Urgaonkar (Penn. State U.), and Rahul Urgaonkar (Raytheon BBN Technologies)
          •   CDN+バッテリー
              →電力需要が低いときに充電、高いときに放電しながら電力を賄うことで、ピーク電力需要
              を下げる
          •   充放電を繰り返すのでバッテリーの寿命が問題
     – OS-Sommelier: Memory-Only Operating System Fingerprinting in the Cloud
          •   Yufei Gu (U. of Texas at Dallas), Yangchun Fu (U. of Texas at Dallas), Aravind Prakash (Syracuse U.),
              Zhiqiang Lin (U. of Texas at Dallas), and Heng Yin (Syracuse U.)
     – Probabilistic Deduplication for Cluster-Based Storage Systems
          •   Davide Frey (INRIA Rennes), Anne-Marie Kermarrec (INRIA Rennes), and Konstantinos Kloudas
              (INRIA Rennes)
     – Dual Stack Virtualization: Consolidating HPC and Commodity Applications in the
       Cloud (**),
          •   Brian Kocoloski (U. of Pittsburgh), Jiannan Ouyang (U. of Pittsburgh), and John Lange (U. of
              Pittsburgh)
          •   HPCアプリとStandardアプリのコンソリデーションをしたい
          •   Palacios VMM (HPC VMM)、KVMを同一ノードで並列に動作させ、その上でHPCアプリ、
              Standardアプリを実行する
まとめ
•   クラウドコンピューティングに関する国際会議は非常に多い
    –   IEEE Cloud
    –   IEEE CloudCom
    –   ACM SoCC
    –   USENIX ATC, HotCloud
    –   ISC Cloud
    –   …
•   この中でSoCCとUSENIXは比較的技術
    Centric
    –   スケジューリング
    –   I/O性能
    –   Data Intensive Computing
    –   ミドルウェア
    –   セキュリティ
•   HPC業界との違い
    – Bay AreaのIndustryからのコミットが目立つ
    – アプリケーションとインタークラウドの話はほとんど語られない

More Related Content

Viewers also liked

Acetogenins In Vivo re: Wu - (p 22-36)
Acetogenins In Vivo re: Wu - (p 22-36)Acetogenins In Vivo re: Wu - (p 22-36)
Acetogenins In Vivo re: Wu - (p 22-36)Ben Rockefeller
 
ACG-123-Pawpaw vs. cancer-in vivo-in vitro-MOA McLaughlin-US-2008
ACG-123-Pawpaw vs. cancer-in vivo-in vitro-MOA McLaughlin-US-2008ACG-123-Pawpaw vs. cancer-in vivo-in vitro-MOA McLaughlin-US-2008
ACG-123-Pawpaw vs. cancer-in vivo-in vitro-MOA McLaughlin-US-2008Ben Rockefeller
 
ACG-186-MOA-Cortes-ES-2005
ACG-186-MOA-Cortes-ES-2005ACG-186-MOA-Cortes-ES-2005
ACG-186-MOA-Cortes-ES-2005Ben Rockefeller
 
Acetogenins In Vivo re: McLaughlin
Acetogenins In Vivo re: McLaughlinAcetogenins In Vivo re: McLaughlin
Acetogenins In Vivo re: McLaughlinBen Rockefeller
 
ACG-221-Synthesis-Asimicin-GSK-Novartis-Pfizer-Ley-cambridge university-uk-2005
ACG-221-Synthesis-Asimicin-GSK-Novartis-Pfizer-Ley-cambridge university-uk-2005ACG-221-Synthesis-Asimicin-GSK-Novartis-Pfizer-Ley-cambridge university-uk-2005
ACG-221-Synthesis-Asimicin-GSK-Novartis-Pfizer-Ley-cambridge university-uk-2005Ben Rockefeller
 
How to create Design Strategy for a brand
How to create Design Strategy for a brandHow to create Design Strategy for a brand
How to create Design Strategy for a brandbala murugan
 
Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類
Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類
Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類Hirotaka Ogawa
 

Viewers also liked (8)

Acetogenins In Vivo re: Wu - (p 22-36)
Acetogenins In Vivo re: Wu - (p 22-36)Acetogenins In Vivo re: Wu - (p 22-36)
Acetogenins In Vivo re: Wu - (p 22-36)
 
ACG-123-Pawpaw vs. cancer-in vivo-in vitro-MOA McLaughlin-US-2008
ACG-123-Pawpaw vs. cancer-in vivo-in vitro-MOA McLaughlin-US-2008ACG-123-Pawpaw vs. cancer-in vivo-in vitro-MOA McLaughlin-US-2008
ACG-123-Pawpaw vs. cancer-in vivo-in vitro-MOA McLaughlin-US-2008
 
ACG-186-MOA-Cortes-ES-2005
ACG-186-MOA-Cortes-ES-2005ACG-186-MOA-Cortes-ES-2005
ACG-186-MOA-Cortes-ES-2005
 
Acetogenins In Vivo re: McLaughlin
Acetogenins In Vivo re: McLaughlinAcetogenins In Vivo re: McLaughlin
Acetogenins In Vivo re: McLaughlin
 
ACG MIR
ACG MIRACG MIR
ACG MIR
 
ACG-221-Synthesis-Asimicin-GSK-Novartis-Pfizer-Ley-cambridge university-uk-2005
ACG-221-Synthesis-Asimicin-GSK-Novartis-Pfizer-Ley-cambridge university-uk-2005ACG-221-Synthesis-Asimicin-GSK-Novartis-Pfizer-Ley-cambridge university-uk-2005
ACG-221-Synthesis-Asimicin-GSK-Novartis-Pfizer-Ley-cambridge university-uk-2005
 
How to create Design Strategy for a brand
How to create Design Strategy for a brandHow to create Design Strategy for a brand
How to create Design Strategy for a brand
 
Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類
Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類
Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類
 

Similar to SoCC12報告

Presto As A Service - Treasure DataでのPresto運用事例
Presto As A Service - Treasure DataでのPresto運用事例Presto As A Service - Treasure DataでのPresto運用事例
Presto As A Service - Treasure DataでのPresto運用事例Taro L. Saito
 
Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014Makoto Yui
 
Data Center As A Computer 2章前半
Data Center As A Computer 2章前半Data Center As A Computer 2章前半
Data Center As A Computer 2章前半Akinori YOSHIDA
 
経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめ経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめYasushi Hara
 
Enterprise cloud design pattern 大量データ処理アーキテクチャの構築
Enterprise cloud design pattern 大量データ処理アーキテクチャの構築Enterprise cloud design pattern 大量データ処理アーキテクチャの構築
Enterprise cloud design pattern 大量データ処理アーキテクチャの構築貴志 上坂
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムRecruit Technologies
 
マイニング探検会#10
マイニング探検会#10マイニング探検会#10
マイニング探検会#10Yoji Kiyota
 
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保するDNA Data Bank of Japan center
 
20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructurePreferred Networks
 
20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術Preferred Networks
 
ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題Kenta Oono
 
USENIX NSDI17 Memory Disaggregation
USENIX NSDI17 Memory DisaggregationUSENIX NSDI17 Memory Disaggregation
USENIX NSDI17 Memory DisaggregationKuniyasu Suzaki
 
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
[DL輪読会]EfficientDet: Scalable and Efficient Object DetectionDeep Learning JP
 
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages. Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages. Satoshi Kato
 
Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価
Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価
Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価Masahito Ohue
 

Similar to SoCC12報告 (20)

Presto As A Service - Treasure DataでのPresto運用事例
Presto As A Service - Treasure DataでのPresto運用事例Presto As A Service - Treasure DataでのPresto運用事例
Presto As A Service - Treasure DataでのPresto運用事例
 
Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014Panel Discussion@WebDB forum 2014
Panel Discussion@WebDB forum 2014
 
Data Center As A Computer 2章前半
Data Center As A Computer 2章前半Data Center As A Computer 2章前半
Data Center As A Computer 2章前半
 
IEEE/ACM SC2013報告
IEEE/ACM SC2013報告IEEE/ACM SC2013報告
IEEE/ACM SC2013報告
 
経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめ経済学のための実践的データ分析 4.SQL ことはじめ
経済学のための実践的データ分析 4.SQL ことはじめ
 
Enterprise cloud design pattern 大量データ処理アーキテクチャの構築
Enterprise cloud design pattern 大量データ処理アーキテクチャの構築Enterprise cloud design pattern 大量データ処理アーキテクチャの構築
Enterprise cloud design pattern 大量データ処理アーキテクチャの構築
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
 
マイニング探検会#10
マイニング探検会#10マイニング探検会#10
マイニング探検会#10
 
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
[DDBJing31] 軽量仮想環境を用いてNGSデータの解析再現性を担保する
 
20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure20180723 PFNの研究基盤 / PFN research system infrastructure
20180723 PFNの研究基盤 / PFN research system infrastructure
 
20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術20180729 Preferred Networksの機械学習クラスタを支える技術
20180729 Preferred Networksの機械学習クラスタを支える技術
 
Overview and Roadmap
Overview and RoadmapOverview and Roadmap
Overview and Roadmap
 
ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題ディープラーニング最近の発展とビジネス応用への課題
ディープラーニング最近の発展とビジネス応用への課題
 
USENIX NSDI17 Memory Disaggregation
USENIX NSDI17 Memory DisaggregationUSENIX NSDI17 Memory Disaggregation
USENIX NSDI17 Memory Disaggregation
 
StreamGraph
StreamGraphStreamGraph
StreamGraph
 
NeurIPS2019参加報告
NeurIPS2019参加報告NeurIPS2019参加報告
NeurIPS2019参加報告
 
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
[DL輪読会]EfficientDet: Scalable and Efficient Object Detection
 
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages. Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
 
Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価
Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価
Microsoft Azure上でのタンパク質間相互作用予測システムの並列計算と性能評価
 
JAWS DAYS 2022
JAWS DAYS 2022JAWS DAYS 2022
JAWS DAYS 2022
 

Recently uploaded

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 

Recently uploaded (8)

デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 

SoCC12報告

  • 1. 3rd ACM Symposium on Cloud Computing (SoCC2012) 報告 独立行政法人産業技術総合研究所 情報技術研究部門 小川 宏高 2012/11/30 第36回グリッド協議会 資料
  • 2. SoCC12概要 • 3rd ACM Symposium on Cloud Computing – October 14th-17th, 2012 – San Jose, CA – http://www.socc2012.org/ – 第1回はSIGMOD、第2回はSOSPと併設→今年から独立 – 25 papers (21 full-length papers) / 163 submissions≒15.3% – 評価がしっかりしている論文が多い • クラウド化・ソーシャル化 – ホームページ → Google Sites – Proceedings → Dropbox • おかげでプログラムが2週間前にしか確定しない→旅程が立てづらい – コンファレンスバッグ→当然省略 – 座席は円卓 • スクール形式に変更するとコストアップ • 円卓なので自然に隣の人と話す – Twitter Day 1 • Keynote Keynote – Software-Defined Networking: Overview and Implications, Day 2 Scott Shenker (UCB) Day 3 Tutorial – http://www.slideshare.net/martin_casado/sdn-abstractions とほぼ同じ • Tutorial – Designing Good Algorithms for Map-Reduce and Beyond • 計算と通信のバランス、Reducer skewのマネジメント – Open Source Cloud Technologies • OpenStack, CloudStack
  • 3. Day 1 Day 1 (1/3) Day 2 Day 3 Tutorial • Goal-Oriented Resource Management – Cake: Enabling High-level SLOs on Shared Storage Systems • Andrew Wang (UCB), Shivaram Venkataraman (UCB), Sara Alspaugh (UCB), Randy Katz (UCB), and Ion Stoica (UCB) • 多数のバッチジョブ、インタラクティブジョブが混在するクラウド環境でSLOを満たすリ ソーススケジューリングを実現 (2-level scheduling) • 1st: ラージジョブのチャンキング、2nd: SLOを満たすようにリソース割り当て – Bridging the Tenant-Provider Gap in Cloud Services • Virajith Jalaparti (UIUC), Hitesh Ballani (MSR), Paolo Costa (Imperial College London), Thomas Karagiannis (MSR), and Ant Rowstron (MSR) • Bazzar: ジョブスペックと完了時間を与えるとリソースタプルを返すスケジューラ (ジョブセ ントリックインタフェース) • MRCuTE: Bazzarの性能予測エンジン、MRジョブのジョブスペックとリソースタプルを与え ると予測完了時刻を返すMRアプリ – Generalizing Resource Allocation for the Cloud • Anshul Rai (MSR India), Ranjita Bhagwan (MSR India), and Saikat Guha (MSR India) • Wrasse: クラウド向けリソース割り当てツール(サービス) • 「Balls and Bins問題を記述したプログラム」としてリソース要求を記述、GPUソルバーで高 速計算 – True Elasticity in Multi-Tenant Clusters through Amoeba (**) • Ganesh Anantharanayanan (UCB), Christopher Douglas (Microsoft), Raghu Ramakrishnan (Microsoft), Sriram Rao (Microsoft), and Ion Stoica (UCB) • Hadoopでは、MRジョブを耐障害性を持つ複数のタスクに分割して実行→リソースの利用効 率と性能の両立が難しい (elasticではない?) • Amoebaでは、checkpoint&restartによるプリエンプションを実現し、その上でMRを実行
  • 4. Day 1 Day 1 (2/3) Day 2 Day 3 Tutorial • Big Data Processing – Improving Large Graph Processing on Partitioned Graphs in the Cloud • Rishan Chen (Beijing U.), Xuetian Weng (Beijing U.), Bingsheng He (Nanyang Technological U.), Mao Yang (MSRA), Byron Choi (Hong Kong Baptist U.), and Xiaoming Li (Beijing U.) – Sailfish: A Framework For Large Scale Data Processing • Sriram Rao (Microsoft), Raghu Ramakrishnan (Microsoft), Adam Silberstein (LinkedIn), Mike Ovsiannikov (Quantcast), and Damian Reeves (Quantcast) • Sailfish: MR処理系の律速要因である中間データの入出力を最適化 • 中間データの交換をI-fileと呼ばれる一種の分散ファイル抽象を介して行うことでバッチI/Oを 実現 • MRの性質からアペンドに特化したlock-free atomic writeのみをサポート • Hadoop MRv2にプラガブルな実装 – Themis: An I/O Efficient MapReduce • Alexander Rasmussen (UCSD), Michael Conley (UCSD), Rishi Kapoor (UCSD), Vinh The Lam (UCSD), George Porter (UCSD), and Amin Vahdat (UCSD) • Themis: MRジョブの多くはI/O律速→I/O操作が最小の実装を目指すもの • タスクレベルの耐故障性機能の除去 (フェイルしたら全体を再実行) • 中間データのディスクスピルを抑制するためにアプリケーションレベルで動的かつ適用的な メモリ割り当てを実現 • シャッフルおよびディスクI/Oの集中管理 (ディスクシークを減らすために複数Mapタスクか らの書き込みをバッファリングしてバッチ書き込みするなど)
  • 5. Day 1 Day 1 (3/3) Day 2 Day 3 Tutorial • Cloudy Workloads & Management – Heterogeneity and Dynamicity of Clouds at Scale: Google Trace Analysis • Charles Reiss (UCB), Alexey Tumanov (CMU), Gregory R. Ganger (CMU), Randy H. Katz (UCB), and Michael A. Kozuch (Intel Labs) • Googleクラスタのトレースデータの分析 • リソースの不均一性(cores:RAM)、タスクの不均一性(実行時間、要求リソース量) →リソースのスロットをタスクに割り当てるスケジューラは不向き • タスクのリソース利用量は動的に大きく変動 →効率良くリソース割り当てするには高速なスケジューリングが肝要 – More for Your Money: Exploiting Performance Heterogeneity in Public Clouds • Benjamin Farley (U. of Wisconsin-Madison), Venkatanathan Varadarajan (U. of Wisconsin-Madison), Kevin Bowers (RSA Laboratories), Ari Juels (RSA Laboratories), Thomas Ristenpart (U. of Wisconsin-Madison), and Michael Swift (U. of Wisconsin-Madison) • 同一料金で提供されているAmazon EC2インスタンスでも性能差がある(CPU, Network, Local disk, EBS) • Placement Gaming: maximize work/$ • オフラインのプロファイリング結果とオンラインの性能計測結果を用いる戦略 – Untangling Cluster Management With Helix • Kishore Gopalakrishna (LinkedIn), Shi Lu (LinkedIn), Zhen Zhang (LinkedIn), Adam Silberstein (LinkedIn), Kapil Surlaker (LinkedIn), Ramesh Subramonian (LinkedIn), Bob Schulman (LinkedIn) • Helix: LinkedInで開発・採用しているオープンソースのクラスタ管理システム • KVS (Espresso)、Messaging (Kafka)、Notification (Databus)、Indexing Service (SeaS)、分散グラ フ処理エンジンなどに統一的にリソース管理、耐故障性、Elasticity, Monitoringを実現する (c.f.,YARN, Mesos) – alsched: Algebraic Scheduling of Mixed Workloads in Heterogeneous Clouds • Alexey Tumanov (CMU), James Cipar (CMU), Michael A. Kozuch (Intel Labs), and Gregory R. Ganger (CMU)
  • 6. Day 1 Day 2 (1/4) Day 2 Day 3 Tutorial • I/O Performance – Using Vector Interfaces to Deliver Millions of IOPS from a Networked Key-value Storage Server • Vijay Vasudevan (CMU), Michael Kaminsky (Intel Labs), and David G. Andersen (CMU) • PCIe SSDをベースにした既存KVS実装ではSWインタフェースで直列化され性能が出ない • ベクターRPC IF – multiple get requests → single multiget request • ベクターストレージIF – 並列ファイルシステムのPOSIX HPC拡張 readx()/writex() に類似 – 複数のバッファ、ファイルディスクリプタを指定して並列読み書きを実現 • 1.6Mreq/sec、1msec latencyを実現 (14倍以上高速化) – vBalance: Using Interrupt Load Balance to Improve I/O Performance for SMP Virtual Machines • Luwei Cheng (U. of Hong Kong) and Cho-Li Wang (U. of Hong Kong) • UP VMだとハードウェア割込を受け取る仮想CPUが確定するが、複数の仮想CPUからなる SMP VMではプリエンプトしている仮想CPUへの割込が発生するとディレイが大きい • プリエンプトしていない動作中の仮想CPUに割り当てることでI/O性能を向上 – Romano: Autonomous Storage Management using Performance Prediction in Multi- Tenant Datacenters • Nohhyun Park (U. of Minnesota), Irfan Ahmad (CloudPhysics), and David J. Lilja (U. of Minnesota)
  • 7. Day 1 Day 2 (2/4) Day 2 Day 3 Tutorial • Data Consistency – All Aboard the Databus! LinkedIn's Scalable Consistent Change Data Capture Platform • Shirshanka Das (LinkedIn), Chavdar Botev (LinkedIn), Kapil Surlaker (LinkedIn), Bhaskar Ghosh (LinkedIn), Balaji Varadarajan (LinkedIn), Sunil Nagaraj (LinkedIn), David Zhang (LinkedIn), Lei Gao (LinkedIn), Jemiah Westerman (LinkedIn), Phanindra Ganti (LinkedIn), Boris Shkolnik (LinkedIn), Sajid Topiwala (LinkedIn), Alexander Pachev (LinkedIn), Naveen Somasundaram (LinkedIn) and Subbu Subramaniam (LinkedIn) • LinkedInで使われている更新通知フレームワーク – Logic and Lattices for Distributed Programming • Neil Conway (UCB), William R. Marczak (UCB), Peter Alvaro (UCB), Joseph M. Hellerstein (UCB), and David Maier (Portland State U.) – How Consistent is your Cloud Application? • Kamal Zellag (McGill U.) and Bettina Kemme (McGill U.) – The Potential Dangers of Causal Consistency and an Explicit Solution (**) • Peter Bailis (UCB), Alan Fekete (U. of Sydney), Ali Ghodsi (UCB), Joseph M. Hellerstein (UCB), and Ion Stoica (UCB)
  • 8. Day 1 Day 2 (3/4) Day 2 Day 3 Tutorial • Load Balancing and Scheduling – Balancing Reducer Skew in MapReduce Workloads using Progressive Sampling • Smriti R Ramakrishnan (Oracle), Garret Swart (Oracle), and Aleksey Urmanov (Oracle) • Reducer Skew: 中間キーのReducerへの割り当ての偏り→Reducerが律速に • 実行時サンプリングデータを元に中間キーの割り当てを平準化 – 頻度の高い中間キーはサブキーに分割して割り当て (Key Chopping) – 頻度が平均的な中間キーは負荷が平均化するように割り当て (Key Packing = greedy bin packing) • Oracle Loader for Hadoop (Hadoopの最終出力をOracle DBに高速書き込み) で使われている – Zeta: Scheduling Interactive Services with Partial Execution (タイトル変更) • Yuxiong He (MSR), Sameh Elnikety (MSR), James Larus (MSR), and Chenyu Yan (Microsoft Bing) • インタラクティブサービス(検索エンジン、金融サービス等)のように時間制約の強いスケジュー リング • 時間がかかるジョブは途中で実行を止めて結果を返す→他のジョブの割り当て遅延を避ける、プ リエンプションのコストを避ける • Bingのバックエンドに組み込んだ実験で検索品質を保ちながらリソースを20%強削減 – Chronos: Predictable Low Latency for Data Center Applications • Rishi Kapoor (UCSD), George Porter (UCSD), Malveeka Tewari (UCSD), Geoffrey M. Voelker (UCSD), and Amin Vahdat (UCSD) • データセンタアプリでは、サービス時間の予測可能性と制御されたレイテンシ(テイルレイテン シ)が重要 • カーネルでの遅延要因(割込ハンドリング、バッファ管理、ネットワークスタック、データコピー 等々)の除去 →ユーザレベル通信APIを提供 • ユーザアプリスレッド間でのロック競合の解決をNICにオフロード →パケットにパーティションIDを付番、NIC上でパーティションIDのハッシュ値を計算してCPU スレッドにマッピング
  • 9. Day 1 Day 2 (4/4) Day 2 Day 3 Tutorial • Cloudy Pot Pourri – Using Batteries to Reduce the Power Costs of Internet-scale Distributed Networks • Darshan S. Palasamudram (Penn. State U.), Ramesh K. Sitaraman (UMass, Amherst & Akamai Tech.), Bhuvan Urgaonkar (Penn. State U.), and Rahul Urgaonkar (Raytheon BBN Technologies) • CDN+バッテリー →電力需要が低いときに充電、高いときに放電しながら電力を賄うことで、ピーク電力需要 を下げる • 充放電を繰り返すのでバッテリーの寿命が問題 – OS-Sommelier: Memory-Only Operating System Fingerprinting in the Cloud • Yufei Gu (U. of Texas at Dallas), Yangchun Fu (U. of Texas at Dallas), Aravind Prakash (Syracuse U.), Zhiqiang Lin (U. of Texas at Dallas), and Heng Yin (Syracuse U.) – Probabilistic Deduplication for Cluster-Based Storage Systems • Davide Frey (INRIA Rennes), Anne-Marie Kermarrec (INRIA Rennes), and Konstantinos Kloudas (INRIA Rennes) – Dual Stack Virtualization: Consolidating HPC and Commodity Applications in the Cloud (**), • Brian Kocoloski (U. of Pittsburgh), Jiannan Ouyang (U. of Pittsburgh), and John Lange (U. of Pittsburgh) • HPCアプリとStandardアプリのコンソリデーションをしたい • Palacios VMM (HPC VMM)、KVMを同一ノードで並列に動作させ、その上でHPCアプリ、 Standardアプリを実行する
  • 10. まとめ • クラウドコンピューティングに関する国際会議は非常に多い – IEEE Cloud – IEEE CloudCom – ACM SoCC – USENIX ATC, HotCloud – ISC Cloud – … • この中でSoCCとUSENIXは比較的技術 Centric – スケジューリング – I/O性能 – Data Intensive Computing – ミドルウェア – セキュリティ • HPC業界との違い – Bay AreaのIndustryからのコミットが目立つ – アプリケーションとインタークラウドの話はほとんど語られない