Extreme‐Scale Parallel Symmetric Eigensolver for Very Small‐Size Matrices Usi...Takahiro Katagiri
We have developed a parallel eigensolver for very small-size matrices. Unlike conventional solvers, our design policy focusses on nature of non-blocking computations and reduced communications. A communication-avoiding approach for Householder pivot vectors is used to implement part of Householder inverse transformation. In addition to that, we implement some techniques for reducing communications by using non-blocking communications in tridiagonalization part. Performance of the solver with full nodes in the Fujitsu FX10 (76,800 cores) is also presented.
本報告では,自動チューニング(AT)を実行するに当たり,コード最適化時に動的なコード生成とコンパイルを行わず,実行前に静的に生成したコードのみを利用するATソフトウェア構成方式のStatic Code Generation Auto-tuning (SCG-AT)を提案する.SCG-ATによるATを評価するにあたり「階層型AT処理」を実装した.差分法による地震波シミュレーションppOpen-APPL/FDMにおいて,従来のベクトル計算機向けコードと新規開発したスカラ計算機向けコードのコード選択処理を実装した.Xeon Phi,Ivy Bridge,およびFX10の3種の全く異なる計算機でSSG-ATによるコード選択のATを評価した.評価の結果,Xeon PhiとIvy Bridgeにおいてはスカラ計算機向けコードの選択により,従来行われていたAT方式では達成できない速度向上が達成できることを明らかにした.
------
ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。
Notice for the use of this material The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof.
All Rights Reserved, Copyright (C) Information Processing Society of Japan.
Comments are welcome. Mail to address editj@ipsj.or.jp, please.
In this research, we show effect of auto-tuning (AT) for function of code selection to computational kernels for scientific and technology computations. ppOpen-AT, which is a computer language to specify AT function to arbitrary parts of program, is utilized to describe the code selection. The evaluation of AT in this research performed with advanced CPU architectures, such as the Intel Xeon Phi and the Intel Ivy Bridge. Results of preliminary experiment with a code based on Finite Difference Method (FDM) indicate that the effect of AT is crucial with compared to conventional AT framework without code selection.
Extreme‐Scale Parallel Symmetric Eigensolver for Very Small‐Size Matrices Usi...Takahiro Katagiri
We have developed a parallel eigensolver for very small-size matrices. Unlike conventional solvers, our design policy focusses on nature of non-blocking computations and reduced communications. A communication-avoiding approach for Householder pivot vectors is used to implement part of Householder inverse transformation. In addition to that, we implement some techniques for reducing communications by using non-blocking communications in tridiagonalization part. Performance of the solver with full nodes in the Fujitsu FX10 (76,800 cores) is also presented.
本報告では,自動チューニング(AT)を実行するに当たり,コード最適化時に動的なコード生成とコンパイルを行わず,実行前に静的に生成したコードのみを利用するATソフトウェア構成方式のStatic Code Generation Auto-tuning (SCG-AT)を提案する.SCG-ATによるATを評価するにあたり「階層型AT処理」を実装した.差分法による地震波シミュレーションppOpen-APPL/FDMにおいて,従来のベクトル計算機向けコードと新規開発したスカラ計算機向けコードのコード選択処理を実装した.Xeon Phi,Ivy Bridge,およびFX10の3種の全く異なる計算機でSSG-ATによるコード選択のATを評価した.評価の結果,Xeon PhiとIvy Bridgeにおいてはスカラ計算機向けコードの選択により,従来行われていたAT方式では達成できない速度向上が達成できることを明らかにした.
------
ここに掲載した著作物の利用に関する注意 本著作物の著作権は情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。
Notice for the use of this material The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof.
All Rights Reserved, Copyright (C) Information Processing Society of Japan.
Comments are welcome. Mail to address editj@ipsj.or.jp, please.
In this research, we show effect of auto-tuning (AT) for function of code selection to computational kernels for scientific and technology computations. ppOpen-AT, which is a computer language to specify AT function to arbitrary parts of program, is utilized to describe the code selection. The evaluation of AT in this research performed with advanced CPU architectures, such as the Intel Xeon Phi and the Intel Ivy Bridge. Results of preliminary experiment with a code based on Finite Difference Method (FDM) indicate that the effect of AT is crucial with compared to conventional AT framework without code selection.
Impact of Auto-tuning of Kernel Loop Transformation by using ppOpen-ATTakahiro Katagiri
SPNS2013, December 5th -6th, 2013, Conference Room, 3F, Bldg.1, Earthquake Research Institute (ERI), The University of Tokyo, December 6th, 2013, ppOpen-HPC and Automatic Tuning (Chair: Hideyuki Jitsumoto), 1330-1400
Towards Automatic Code Selection with ppOpen-AT: A Case of FDM - Variants of ...Takahiro Katagiri
In this study, we show a new ability of auto-tuning (AT) by utilizing selection of code variants based on totally different implementations of numerical computations. The selection function of the AT is carefully designed to apply ppOpen-AT, which is a computer language to adapt AT functions to simulation codes of actual use in ppOpen-HPC project. The AT is evaluated with ppOpen-APPL/FDM (Seism_3D), which is a simulation code of seismic wave based on Finite Difference Method (FDM). According to results of performance evaluation with an advanced multi-core processor, the Xeon Phi, crucial speedups are found by utilizing the selection of AT. Moreover, the best code variants were varied according to parallel executions, i.e. the number of MPI processes and OpenMP threads in hybrid MPI/OpenMP.
Auto‐Tuning of Hierarchical Computations with ppOpen‐ATTakahiro Katagiri
We are now developing ppOpen-AT, which is a directive-base Auto-tuning (AT) language to specify fundamental AT functions, i.e., varying values of parameters, loop transformations, and code selection. Considering with expected hardware of Post Moore’s era, we focus on optimization for computations with deep hierarchy of 3D memory stack. ppOpen-AT provides code selection to optimize code with respect to layers of the memory. Performance evaluation of AT with a code of FDM will be shown by utilizing the Xeon Phi.
29. September bis 4. Oktober 2013, Dagstuhl Seminar 13401, Automatic Application Tuning for HPC Architectures, Session: infrastructures, 10:30-11:00, October 1st (TUE) , 2013.
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)Akira Shibata
Tokyo Web Mining #45でお話させていただいた内容です。
アブストラクト:
実験素粒子物理学においては、加速器を使った高エネルギー素粒子の衝突実験から生まれる大量のデータを分析するため、かつてよりあらゆる科学分野の中でも最もデータ量の多い領域でした。スイスのCERN研究所で行われている最新の実験、LHC(Large Hadron Collider)では、最初の2年間で、1PB(ペタバイト)のデータが生成され、その一部は昨年オープン化されました。本講演では、LHCのビッグデータがどのように解析されたのか、インフラ及びアプリケーションレベルの観点ご紹介します。特に、アプリケーションレベルにおいては、独自の統計解析ライブラリであるROOTが幅広く使われており、この講演を通じ、ROOTが現在のデータ解析パラダイムのどこに位置しているのかを参加者の皆様と議論したいと思います。
ICRA 2018 (IEEE International Conference on Robotics and Automation; https://icra2018.org/ )の参加速報を書きました。
この資料には下記の項目が含まれています。
・ICRA 2018の概要
・ICRA 2018での動向や気付き
・ICRAの重要技術/重要論⽂?
・AIST関連の論文
・今後の方針
・論文まとめ(100本あります)
Impact of Auto-tuning of Kernel Loop Transformation by using ppOpen-ATTakahiro Katagiri
SPNS2013, December 5th -6th, 2013, Conference Room, 3F, Bldg.1, Earthquake Research Institute (ERI), The University of Tokyo, December 6th, 2013, ppOpen-HPC and Automatic Tuning (Chair: Hideyuki Jitsumoto), 1330-1400
Towards Automatic Code Selection with ppOpen-AT: A Case of FDM - Variants of ...Takahiro Katagiri
In this study, we show a new ability of auto-tuning (AT) by utilizing selection of code variants based on totally different implementations of numerical computations. The selection function of the AT is carefully designed to apply ppOpen-AT, which is a computer language to adapt AT functions to simulation codes of actual use in ppOpen-HPC project. The AT is evaluated with ppOpen-APPL/FDM (Seism_3D), which is a simulation code of seismic wave based on Finite Difference Method (FDM). According to results of performance evaluation with an advanced multi-core processor, the Xeon Phi, crucial speedups are found by utilizing the selection of AT. Moreover, the best code variants were varied according to parallel executions, i.e. the number of MPI processes and OpenMP threads in hybrid MPI/OpenMP.
Auto‐Tuning of Hierarchical Computations with ppOpen‐ATTakahiro Katagiri
We are now developing ppOpen-AT, which is a directive-base Auto-tuning (AT) language to specify fundamental AT functions, i.e., varying values of parameters, loop transformations, and code selection. Considering with expected hardware of Post Moore’s era, we focus on optimization for computations with deep hierarchy of 3D memory stack. ppOpen-AT provides code selection to optimize code with respect to layers of the memory. Performance evaluation of AT with a code of FDM will be shown by utilizing the Xeon Phi.
29. September bis 4. Oktober 2013, Dagstuhl Seminar 13401, Automatic Application Tuning for HPC Architectures, Session: infrastructures, 10:30-11:00, October 1st (TUE) , 2013.
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)Akira Shibata
Tokyo Web Mining #45でお話させていただいた内容です。
アブストラクト:
実験素粒子物理学においては、加速器を使った高エネルギー素粒子の衝突実験から生まれる大量のデータを分析するため、かつてよりあらゆる科学分野の中でも最もデータ量の多い領域でした。スイスのCERN研究所で行われている最新の実験、LHC(Large Hadron Collider)では、最初の2年間で、1PB(ペタバイト)のデータが生成され、その一部は昨年オープン化されました。本講演では、LHCのビッグデータがどのように解析されたのか、インフラ及びアプリケーションレベルの観点ご紹介します。特に、アプリケーションレベルにおいては、独自の統計解析ライブラリであるROOTが幅広く使われており、この講演を通じ、ROOTが現在のデータ解析パラダイムのどこに位置しているのかを参加者の皆様と議論したいと思います。
ICRA 2018 (IEEE International Conference on Robotics and Automation; https://icra2018.org/ )の参加速報を書きました。
この資料には下記の項目が含まれています。
・ICRA 2018の概要
・ICRA 2018での動向や気付き
・ICRAの重要技術/重要論⽂?
・AIST関連の論文
・今後の方針
・論文まとめ(100本あります)
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matchingharmonylab
公開URL:https://arxiv.org/pdf/2404.19174
出典:Guilherme Potje, Felipe Cadar, Andre Araujo, Renato Martins, Erickson R. ascimento: XFeat: Accelerated Features for Lightweight Image Matching, Proceedings of the 2024 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) (2023)
概要:リソース効率に優れた特徴点マッチングのための軽量なアーキテクチャ「XFeat(Accelerated Features)」を提案します。手法は、局所的な特徴点の検出、抽出、マッチングのための畳み込みニューラルネットワークの基本的な設計を再検討します。特に、リソースが限られたデバイス向けに迅速かつ堅牢なアルゴリズムが必要とされるため、解像度を可能な限り高く保ちながら、ネットワークのチャネル数を制限します。さらに、スパース下でのマッチングを選択できる設計となっており、ナビゲーションやARなどのアプリケーションに適しています。XFeatは、高速かつ同等以上の精度を実現し、一般的なラップトップのCPU上でリアルタイムで動作します。
セル生産方式におけるロボットの活用には様々な問題があるが,その一つとして 3 体以上の物体の組み立てが挙げられる.一般に,複数物体を同時に組み立てる際は,対象の部品をそれぞれロボットアームまたは治具でそれぞれ独立に保持することで組み立てを遂行すると考えられる.ただし,この方法ではロボットアームや治具を部品数と同じ数だけ必要とし,部品数が多いほどコスト面や設置スペースの関係で無駄が多くなる.この課題に対して音𣷓らは組み立て対象物に働く接触力等の解析により,治具等で固定されていない対象物が組み立て作業中に運動しにくい状態となる条件を求めた.すなわち,環境中の非把持対象物のロバスト性を考慮して,組み立て作業条件を検討している.本研究ではこの方策に基づいて,複数物体の組み立て作業を単腕マニピュレータで実行することを目的とする.このとき,対象物のロバスト性を考慮することで,仮組状態の複数物体を同時に扱う手法を提案する.作業対象としてパイプジョイントの組み立てを挙げ,簡易な道具を用いることで単腕マニピュレータで複数物体を同時に把持できることを示す.さらに,作業成功率の向上のために RGB-D カメラを用いた物体の位置検出に基づくロボット制御及び動作計画を実装する.
This paper discusses assembly operations using a single manipulator and a parallel gripper to simultaneously
grasp multiple objects and hold the group of temporarily assembled objects. Multiple robots and jigs generally operate
assembly tasks by constraining the target objects mechanically or geometrically to prevent them from moving. It is
necessary to analyze the physical interaction between the objects for such constraints to achieve the tasks with a single
gripper. In this paper, we focus on assembling pipe joints as an example and discuss constraining the motion of the
objects. Our demonstration shows that a simple tool can facilitate holding multiple objects with a single gripper.