研究者データベース

研究者情報

マスター

アカウント(マスター)

  • 氏名

    岩下 武史(イワシタ タケシ), イワシタ タケシ

所属(マスター)

  • 情報基盤センター スーパーコンピューティング研究部門

所属(マスター)

  • 情報基盤センター スーパーコンピューティング研究部門

独自項目

syllabus

  • 2020, ハイパフォーマンスコンピューティング特論, High Performance Computing, 修士課程, 情報科学院, スーパーコンピュータ,計算機アーキテクチャ,並列処理,プログラムチューニング
  • 2020, 超高速計算機網工学特論, High-performance and High-speed Network Computing, 修士課程, 情報科学研究科, スーパーコンピュータ,計算機アーキテクチャ,並列処理,プログラムチューニング
  • 2020, ハイパフォーマンスコンピューティング特論, High Performance Computing, 博士後期課程, 情報科学院, スーパーコンピュータ,計算機アーキテクチャ,並列処理,プログラムチューニング
  • 2020, 超高速計算機網工学特論, High-performance and High-speed Network Computing, 博士後期課程, 情報科学研究科, スーパーコンピュータ,計算機アーキテクチャ,並列処理,プログラムチューニング
  • 2020, コンピュータアーキテクチャ, Computer Architecture, 学士課程, 工学部, ハードウェア構成、機械語命令、ノイマン型計算機、並列計算機、スーパーコンピュータ、ファームウェア、マイクロプロセッサ、パイプライン処理、キャッシュメモリ、プロセス、スレッド、スケジューリング、割り込み、デッドロック、メモリ管理、仮想メモリ、ページング、ファイルシステム
  • 2020, コンピュータシステム, Computer Systems, 学士課程, 工学部, ハードウェア構成、機械語命令、ノイマン型計算機、並列計算機、スーパーコンピュータ、ファームウェア、マイクロプロセッサ、パイプライン処理、キャッシュメモリ、プロセス、スレッド、スケジューリング、割り込み、デッドロック、メモリ管理、仮想メモリ、ページング、ファイルシステム
  • 2020, コンピュータサイエンス演習Ⅱ, Exercise in Computer Science Ⅱ, 学士課程, 工学部, コンピュータシステム、ネットワークとクラウド、計算機アーキテクチャ、オペレーティングシステム、コンピュータネットワーク、Web技術、クラウド技術
  • 2020, 情報理工学演習Ⅰ, Exercise in Computer Science and Information Technology I, 学士課程, 工学部, コンピュータシステム、ネットワークとクラウド、計算機アーキテクチャ、オペレーティングシステム、コンピュータネットワーク、Web技術、クラウド技術
  • 2020, コンピュータサイエンス実験Ⅱ, Experiment in Computer Science Ⅱ, 学士課程, 工学部, データベース、Web、機械学習、並列プログラミング
  • 2020, 情報理工学実験Ⅱ, Experiment in Computer Science and Information Technology II, 学士課程, 工学部, データベース、Web、機械学習、並列プログラミング

PositionHistory

  • 情報基盤センター副センター長, 2017年4月1日, 2019年3月31日
  • 情報基盤センター副センター長, 2019年4月1日, 2021年3月31日

researchmap

プロフィール情報

学位

  • 工学博士(京都大学)

プロフィール情報

  • 岩下, イワシタ
  • 武史, タケシ
  • ID各種

    200901000149290174

対象リソース

業績リスト

研究キーワード

  • ハイパフォーマンスコンピューティング   線形計算   並列処理   電磁界解析   Paralell computing   Electromagnetic field nalysis   

研究分野

  • ものづくり技術(機械・電気電子・化学工学) / 電力工学
  • 情報通信 / 情報学基礎論

経歴

  • 2017年04月 - 現在 北海道大学 情報基盤センター 副センター長
  • 2014年04月 - 現在 北海道大学 情報基盤センター 教授
  • 2003年10月 - 2014年03月 京都大学 学術情報メディアセンター 准教授/助教授
  • 2000年01月 - 2003年10月 京都大学 大型計算機センター/学術情報メディアセンター 助手
  • 1998年04月 - 1999年12月 京都大学 大学院工学研究科 リサーチアソシエイト(JSPS-PD)

学歴

  • 1993年04月 - 1998年03月   京都大学大学院   工学研究科   電気工学専攻
  • 1989年04月 - 1993年03月   京都大学 工学部 電気工学科

委員歴

  • 2020年01月 - 現在   HPC Asia   Steering committee member
  • 2018年04月 - 現在   情報処理学会 ハイパフォーマンスコンピューティング研究会   主査
  • 2018年04月 - 現在   情報処理学会論文誌コンピューティングシステム 編集委員会   編集委員
  • 2018年04月 - 現在   IEEE IRDS   Application benchmark section member
  • 2017年04月 - 現在   HPCI連携サービス委員会   委員
  • 2013年05月 - 現在   自動チューニング研究会   幹事
  • 2012年04月 - 現在   理化学研究所計算科学研究機構 連携サービス運営・作業部会   委員
  • 2010年04月 - 現在   日本応用数理学会 行列・固有値部会   運営委員
  • 2020年10月 - 2021年06月   ICCS2021   Program Committee Member
  • 2018年01月 - 2020年01月   HPCAsia2020   General Chair
  • 2012年04月 - 2019年12月   筑波大学計算科学研究センター 共同研究委員会   委員
  • 2018年08月 - 2019年08月   ICPP2019   Program Committee Member
  • 2018年09月 - 2019年06月   ICCS2019   Program Committee Member
  • 2018年01月 - 2019年01月   HPCAsia2019   Program Committee Co-Chair
  • 2017年10月 - 2018年11月   SC|18   Tutorial Committee Member
  • 2017年11月 - 2018年06月   ICCS2018   Program Committee Member
  • 2015年04月 - 2018年03月   情報処理学会ハイパフォーマンスコンピューティング研究会   運営委員
  • 2017年03月 - 2018年01月   HPCAsia2018   Program Committee Track Chair
  • 2016年10月 - 2017年11月   SC|17   Tutorial Committee Member
  • 2016年10月 - 2017年11月   SC|17   Poster Committee Member
  • 2016年11月 - 2017年06月   ICCS2017   Program Committee Member
  • 2015年04月 - 2017年03月   情報処理学会論文誌コンピューティングシステム 編集委員会   副委員長
  • 2016年03月 - 2016年11月   SC|16   Tutorial Committee Member
  • 2015年09月 - 2016年09月   IEEE Cluster2016 Program Committee   Member
  • 2015年09月 - 2016年07月   VECPAR2016 Scientific Committee   Member
  • 2015年08月 - 2016年06月   ICCS2016 Program Committee   Member
  • 2015年03月 - 2016年06月   ACM HPDC2016   Local Chair
  • 2015年04月 - 2016年01月   ACSI2016 組織委員会   副委員長
  • 2014年12月 - 2015年07月   COMPUMAG2015 Editorial Board   Member
  • 2014年09月 - 2015年05月   iWAPT2015 Program Committee   Member
  • 2013年05月 - 2015年03月   ACSI2015 プログラム委員会   委員長
  • 2011年04月 - 2015年03月   情報処理学会ハイパフォーマンスコンピューティング研究会   幹事
  • 2014年01月 - 2014年11月   SC|14 Poster Committee   Member
  • 2013年09月 - 2014年07月   VECPAR2014 Scientific Committee   Member
  • 2012年11月 - 2013年11月   SC|13 Program Committee   Member
  • 2012年06月 - 2013年06月   iWAPT2013 Program Committee   Chair
  • 2012年08月 - 2013年05月   SACSIS2013 プログラム委員会   トラックチェア
  • 2011年06月 - 2012年06月   iWAPT2012 Program Committee   Vice Chair
  • 2011年05月 - 2012年01月   HPCS2012 実行委員会   副委員長
  • 2010年08月 - 2011年09月   CCGrid2011 Program Committee   Member
  • 2007年04月 - 2011年03月   情報処理学会ハイパフォーマンスコンピューティング研究会   運営委員
  • 2009年11月 - 2010年11月   SC|11 Program Committee   Member
  • 2009年05月 - 2010年01月   HPCS2010 プログラム委員会   副委員長(広報・ポスター担当)
  • 2007年05月 - 2008年01月   HPCS2008 プログラム委員会   副委員長(論文担当)

受賞

  • 2018年05月 情報処理学会シンポジウム xSIG2018 Best Research Award
     
    受賞者: 李 森曦;岩下 武史;深谷 猛
  • 2012年01月 HPCS2012 最優秀論文賞
  • 2009年 電気学会 電力・エネルギー部門優秀論文賞
  • 2007年 情報処理学会 山下記念研究賞
  • 1997年 電気学会 研究会 論文発表賞
  • 1996年 電気学会 関西支部連合大会 奨励賞
  • 1996年 電気学会 電力・エネルギー部門大会 論文発表賞

論文

  • Yasuhito Takahashi, Koji Fujiwara, Takeshi Iwashita, Hiroshi Nakashima
    IEEE TRANSACTIONS ON MAGNETICS 57 6 2021年06月 [査読有り]
     
    This article investigates the effectiveness of two parallel-in-space-and-time (PinST) finite-element methods (FEMs) in magnetic field analyses of practical electric machines. A combination of an ordinary domain decomposition method (DDM) with a parallel time-periodic FEM is compared with a PinST FEM based on the DDM combined with a parallel time-periodic explicit-error-correction method. To clarify and compare the performances of the two methods in terms of their parallel efficiencies, numerical results of an interior permanent magnet synchronous motor are presented.
  • Takeshi Fukaya, Koki Ishida, Akie Miura, Takeshi Iwashita, Hiroshi Nakashima
    CoRR abs/2105.04937 2021年
  • Takeshi Iwashita, Kengo Suzuki, Takeshi Fukaya
    2020 IEEE/ACM 11th Workshop on Latest Advances in Scalable Algorithms for Large-Scale Systems (ScalA) 1 - 8 2020年11月 [査読有り]
  • Parallel-in-Space-and-Time Finite-Element Analysis of Electric Machines using Domain Decomposition and Time-Periodic Finite-Element Method
    Yasuhito Takahashi, Koji Fujiwara, Takeshi Iwashita, Hiroshi Nakashima
    Proc. 19th Biennial Conf. Electromagnetic Field Computation 2020年04月 [査読有り][通常論文]
  • Rise Ooi, Takeshi Iwashita, Takeshi Fukaya, Akihiro Ida, Rio Yokota
    HPCAsia2020 92 - 101 2020年 [査読有り][通常論文]
  • Takahashi Yasuhito, Fujiwara Koji, Iwashita Takeshi, Nakashima Hiroshi
    COMPEL-THE INTERNATIONAL JOURNAL FOR COMPUTATION AND MATHEMATICS IN ELECTRICAL AND ELECTRONIC ENGINEERING 38 5 1507 - 1520 2019年09月02日 [査読有り][通常論文]
  • Mifune Takashi, Tominaga Naoki, Sogabe Yusuke, Mizobata Yudai, Yasunaga Masahiro, Ida Akihiro, Iwashita Takeshi, Amemiya Naoyuki
    SUPERCONDUCTOR SCIENCE & TECHNOLOGY 32 9 2019年09月 [査読有り][通常論文]
  • Parallel TP-EEC Method based on Polyphase Time-Periodic Condition for Magnetic Field Analysis of Induction Motors
    Yasuhito Takahashi, Koji Fujiwara, Tadashi Tokumasu, Takeshi Iwashita, Hiroshi Nakashima
    Proc. Intl. Conf. Computation on Electromagnetic Fields 2019年07月 [査読有り][通常論文]
  • Iwashita Takeshi, Kawaguchi Shigeru, Mifune Takeshi, Matsuo Tetsuji
    IEEE TRANSACTIONS ON MAGNETICS 55 6 2019年06月 [査読有り][通常論文]
  • Yasuhito Takahashi, Koji Fujiwara, Takeshi Iwashita, Hiroshi Nakashima
    IEEE Trans. Magnetics 55 1 - 4 2019年02月 [査読有り][通常論文]
  • Senxi Li, Takeshi Iwashita, Takeshi Fukaya
    JIP 27 201 - 210 2019年 [査読有り][通常論文]
  • Akihiro Ida, Hiroshi Nakashima, Tasuku Hiraishi, Ichitaro Yamazaki, Rio Yokota, Takeshi Iwashita
    Journal of Information Processing 27 831 - 839 2019年 [査読有り][通常論文]
  • Rise Ooi, Takeshi Iwashita, Takeshi Fukaya, Akihiro Ida, Rio Yokota
    CoRR abs/1911.00093 2019年 [査読有り][通常論文]
  • Parallel Finite Element Analysis of Transient Motor Starting Using Domain Decomposition and Parareal
    Yasuhito Takahashi, Koji Fujiwara, Takeshi Iwashita, Hiroshi Nakashima
    Proc. Intl. IGTE Symp. 2018年09月 [査読有り][通常論文]
  • DIA形式とCRS形式を組み合わせたHybrid形式を用いた疎行列ベクトル積のキャッシュブロッキング
    石田幸輝, 三浦瑛絵, 深谷猛, 岩下武史, 中島浩
    Proc, Cross-disciplinary WS. Computing Systems, Infrastructures, and Programming 2018年05月 [査読有り][通常論文]
  • Naoki Tominaga, Takeshi Mifune, Akihiro Ida, Yusuke Sogabe, Takeshi Iwashita, Naoyuki Amemiya
    IEEE Transactions on Applied Superconductivity 28 3 2018年04月01日 [査読有り][通常論文]
     
    Because the coefficient matrix is dense in the electromagnetic-field-analysis models of coated conductors using current vector potentials, the analyses of large-scale coils require a large amount of memory and long computation time. In this paper, we introduce hierarchical matrices by using the HACApK library in order to reduce both memory consumption and computation time. The effect of the method with respect to memory consumption and computation time is examined in numerical tests using a pancake coil wound with a coated conductor. The effect of parallel computations is also examined. Finally, we analyzed a large-scale magnet, with 1.5 million unknown values.
  • Akihiro Ida, Tadashi Ataka, Yasuhito Takahashi, Takeshi Mifune, Takeshi Iwashita, Atsushi Furuya
    IEEE Transactions on Magnetics 54 3 2018年03月01日 [査読有り][通常論文]
     
    This paper examines the applicability of hierarchical-matrices (H-matrices) to a computation of the demagnetizing field, which is the most time-consuming part in the micromagnetic simulation of spin torque oscillators (STO). Given that the kernel function of the convolution integral operator for the demagnetizing field has a second-order singularity, efficient approximation cannot be expected using conventional H-matrices employing adaptive cross approximation as the low-rank approximation. We introduce improved H-matrices to overcome this challenge. Furthermore, matrix sizes appearing in STO simulations are relatively small compared with the usual sizes of H-matrices. Through numerical experiments, we confirm the size conditions for memory usage and the computational time of H-matrix-vector products to demonstrate the advantages of using H-matrices.
  • Takeshi Fukaya, Takeshi Iwashita
    ACM International Conference Proceeding Series 116 - 126 2018年01月28日 [査読有り][通常論文]
     
    Our aim in this work is to improve the performance of the multi-threaded 3D FDTD solver using time-space tiling techniques that enable tile-level parallelization. The implementation of tile-level parallelization that we have used is based on the so-called diamond tiling technique. In this paper, we present a systematic manner for introducing time-space tiling techniques into the 3D FDTD solver and compare four different approaches. Our performance evaluation on a state-of-the-art multi-core processor demonstrated the effectiveness of the time-space tiling techniques with tile-level parallelism for the 3D FDTD method. For the problem with 2003 grid points, our implementation with two-dimensional tile-level parallelism achieved a speedup of 1.88 times over the naive implementation, while for the problem of 3003 grid points, our implementation with one-dimensional tile-level parallelism showed a speedup of 2.22 times. Both results are better than the speedup obtained from an implementation with intra-tile parallelization presented in a previous work.
  • Yasuhito Takahashi, Junji Kitao, Koji Fujiwara, Akira Ahagon, Tetsuji Matsuo, Takeshi Iwashita, Hiroshi Nakashima
    IEEE TRANSACTIONS ON MAGNETICS 53 6 2017年06月 [査読有り][通常論文]
     
    In this paper, we introduce a novel approach for obtaining steady-state solutions in time-periodic magnetic field analyses considering hysteresis. First, we extract the poorly converged error component in transient calculations using the parallel time-periodic explicit-error correction method. Then, tentative steady-state solutions are obtained for each element by correcting the extracted error components. Based on the tentative periodic waveforms of the flux density vectors, the magnetization history of each element is also corrected. Numerical results are presented to demonstrate the effectiveness of the developed approach.
  • Takeshi Iwashita, Akihiro Ida, Takeshi Mifune, Yasuhito Takahashi
    INTERNATIONAL CONFERENCE ON COMPUTATIONAL SCIENCE (ICCS 2017) 108 2200 - 2209 2017年 [査読有り][通常論文]
     
    A software framework has been developed for use in parallel boundary element method (BEM) analyses. The framework program was parallelized in a hybrid parallel programming model, and both multiple processes and threads were used. Additionally, an H-matrix library for a distributed memory parallel computer was also developed to accelerate the analysis. In this paper, we describe the basic design concept for the framework and details of its implementation. The framework program, which was written with MPI functions and OpenMP directives, is mainly intended to reduce the user's parallel programming costs. We also show the results of a sample analysis performed with approximately 60,000 unknowns. The numerical results verify the effectiveness of both the parallelization and the H-matrix method. In the test analysis, which was performed using a single core, the H-matrix version of the framework is 17-fold faster than the dense matrix version. The parallel framework program with the H-matrix attains an approximately 50-fold acceleration using 128 cores when compared with sequential computation. (C) 2017 The Authors. Published by Elsevier B.V.
  • Iwashita Takeshi, Kawaguchi Shigeru, Mifune Takeshi, Matsuo Tetsuji
    JSIAM LETTERS 9 25 - 28 2017年 [査読有り][通常論文]
  • Satoshi Matsuoka, Hideharu Amano, Kengo Nakajima, Koji Inoue, Tomohiro Kudoh, Naoya Maruyama, Kenjiro Taura, Takeshi Iwashita, Takahiro Katagiri, Toshihiro Hanawa, Toshio Endo
    2016 ACM International Conference on Computing Frontiers - Proceedings 274 - 281 2016年05月16日 [査読有り][通常論文]
     
    Slowdown and inevitable end in exponential scaling of processor performance, the end of the so-called"Moore's Law" is predicted to occur around 2025-2030 timeframe. Because CMOS semiconductor voltage is also approaching its limits, this means that logic transistor power will become constant, and as a result, the system FLOPS will cease to improve, resulting in serious consequences for IT in general, especially supercomputing. Existing attempts to overcome the end of Moore's law are rather limited in their future outlook or applicability. We claim that data-oriented parameters, such as bandwidth and capacity, or BYTES, are the new parameters that will allow continued performance gains for periods even after computing performance or FLOPS ceases to improve, due to continued advances in storage device technologies and optics, and manufacturing technologies including 3-D packaging. Such transition from FLOPS to BYTES will lead to disruptive changes in the overall systems from applications, algorithms, software to architecture, as to what parameter to optimize for, in order to achieve continued performance growth over time. We are launching a new set of research efforts to investigate and devise new technologies to enable such disruptive changes from FLOPS to BYTES in the Post-Moore era, focusing on HPC, where there is extreme sensitivity to performance, and expect the results to disseminate to the rest of IT.
  • Akihiro Ida, Takeshi Iwashita, Takeshi Mifune, Yasuhito Takahashi
    IEEE TRANSACTIONS ON MAGNETICS 52 3 7205104  2016年03月 [査読有り][通常論文]
     
    This paper discusses Krylov subspace methods to solve a linear system whose coefficient matrix is represented by a hierarchical matrix. We propose a preconditioning technique using a part of the original hierarchical matrix to accelerate the convergence of the Krylov subspace methods. The proposed preconditioning technique is based on the assumption that the submatrices on the original hierarchical matrix are approximated using the adaptive cross approximation or variants thereof. The performance of Krylov subspace methods with the proposed preconditioning technique is examined through numerical experiments on an electrostatic field analysis.
  • Yasuhito Takahashi, Koji Fujiwara, Takeshi Iwashita, Hiroshi Nakashima
    IEEE TRANSACTIONS ON MAGNETICS 52 3 7401604  2016年03月 [査読有り][通常論文]
     
    This paper investigates the effectiveness of a parallel finite-element method based on a domain decomposition method taking account of nonconforming mesh connection between moving and fixed parts in magnetic field analyses of rotating machines. Numerical results of interbar current analyses in a cage induction motor that verify the effectiveness of the proposed method are presented.
  • Shigeru Kawaguchi, Takeshi Mifune, Takeshi Iwashita, Tetsuji Matsuo
    2016 IEEE CONFERENCE ON ELECTROMAGNETIC FIELD COMPUTATION (CEFC) 2016年 [査読有り][通常論文]
     
    We introduce a method to construct a mapping matrix for the error correction method based on the information obtained in preceding solution processes in a time-marching finite-element analysis. We show the results of an application of this method to an eddy current problem. They indicate that this method reduces the number of iterations of an iterative matrix solver to at most 35%.
  • Y. Takahashi, J. Kitao, K. Fujiwara, A. Ahagon, T. Matsuo, T. Iwashita, H. Nakashima
    2016 IEEE CONFERENCE ON ELECTROMAGNETIC FIELD COMPUTATION (CEFC) 2016年 [査読有り][通常論文]
     
    This paper investigates a novel approach for obtaining steady-state solutions in time-periodic magnetic field analyses considering hysteretic property. First, we extract poorly converged error component in transient calculations using the parallel TP-EEC method. Then, tentative steady-state solutions are obtained in each element by the correction of the extracted error components. Based on the time-series data of flux density vectors, magnetization history in each element is also corrected. Numerical results that demonstrate the effectiveness of the developed approach are presented.
  • Kengo Nakajima, Masaki Satoh, Takashi Furumura, Hiroshi Okuda, Takeshi Iwashita, Hide Sakaguchi, Takahiro Katagiri, Masaharu Matsumoto, Satoshi Ohshima, Hideyuki Jitsumoto, Takashi Arakawa, Futoshi Mori, Takeshi Kitayama, Akihiro Ida, Miki Y. Matsuo
    OPTIMIZATION IN THE REAL WORLD: TOWARD SOLVING REAL-WORLD OPTIMIZATION PROBLEMS 13 15 - 35 2016年 [査読有り][通常論文]
     
    ppOpen-HPC is an open source infrastructure for development and execution of large-scale scientific applications on post-peta-scale (pp) supercomputers with automatic tuning (AT). ppOpen-HPC focuses on parallel computers based on many-core architectures and consists of various types of libraries covering general procedures for scientific computations. The source code, developed on a PC with a single processor, is linked with these libraries, and the parallel code generated is optimized for post-peta-scale systems. In this article, recent achievements and progress of the ppOpen-HPC project are summarized.
  • Yasuhito Takahashi, Tadashi Tokumasu, Koji Fujiwara, Takeshi Iwashita, Hiroshi Nakashima
    IEEE TRANSACTIONS ON MAGNETICS 51 3 2015年03月 [査読有り][通常論文]
     
    This paper proposes a novel parallel computation technique in the time domain for use in finite-element analyses of time-periodic nonlinear magnetic fields. The proposed method is based on converting problems from single phase to multiple phase and the polyphase time-periodic explicit error correction method. Numerical results that demonstrate its effectiveness are presented.
  • Yasuhito Takahashi, Akira Ahagon, Koji Fujiwara, Takeshi Iwashita, Hiroshi Nakashima
    IET SCIENCE MEASUREMENT & TECHNOLOGY 9 2 178 - 183 2015年03月 [査読有り][通常論文]
     
    This study investigates the efficiency of a boundary element method (BEM) enhanced by a parallelised fast multipole method (FMM) in analyses of electric field induced in the human body because of low-frequency magnetic field. The formulations of the BEM and FEM specialised for induced field analysis are presented. The scalability of the indirect BEM with the FMM in a distributed computing environment with over 100 processes is examined with pure message passing interface programming model. Numerical results of an anatomically-based human body model obtained from the BEM and FEM are discussed from the standpoints of accuracy and computational cost.
  • A Fill-In Strategy for Fast ICCG Solver with SIMD Vectorization
    Takeshi Iwashita, Naokazu Takemura, Hiroshi Nakashima
    Annual Meeting on Advanced Computing System and Infrastructure 2015年01月 [査読有り][通常論文]
  • Takeshi Iwashita, Naokazu Takemura, Akihiro Ida, Hiroshi Nakashima
    2015 IEEE TRUSTCOM/BIGDATASE/ISPA, VOL 3 37 - 44 2015年 [査読有り][通常論文]
     
    Most of current processors are equipped with single instruction multiple data (SIMD) instructions that are used to increase the performance of application programs. In this paper, we analyze the effective use of SIMD instructions in the Incomplete Cholesky (IC) preconditioned Conjugate Gradient (CG) solver, which we employ in a variety of simulations. A new fill-in strategy in the IC factorization is proposed for the SIMD vectorization of the preconditioning step and to increase the convergence rate. Our numerical results confirm that the proposed method has better solver performance than the conventional IC(0)-CG method.
  • Akihiro Ida, Takeshi Iwashita, Makiko Ohtani, Kazuro Hirahara
    Journal of Information Processing 23 3 366 - 372 2015年 [査読有り][通常論文]
     
    We propose an improved method for hierarchical-matrices (H-matrices) using adaptive cross approximation (ACA) as the low-rank approximation. The improvement consists of a kind of normalization and a new stopping criterion for the ACA. By using the proposed method, we can avoid the trouble that ranks of approximated matrices increase rapidly as the matrix size increases when the conventional H-matrices with ACA are employed to an integral equation whose kernel function has high-order singularities. In particular, application of the proposed method enables us to perform large-scale simulations such that the conventional H-matrices with ACA fail to construct the low-rank approximation. Applicability of the proposed method is confirmed through numerical experiments on an earthquake cycle simulation.
  • Takeshi Minami, Motoharu Hibino, Tasuku Hiraishi, Takeshi Iwashita, Hiroshi Nakashima
    HIGH PERFORMANCE COMPUTING FOR COMPUTATIONAL SCIENCE - VECPAR 2014 8969 284 - 297 2015年 [査読有り][通常論文]
     
    This paper introduces an automatic tuning method for the tiling parameters required in an implementation of the three-dimensional FDTD method based on time-space tiling. In this tuning process, an appropriate range for the tile size is first determined by trial experiments using cubic tiles. The tile shape is then optimized by using the Monte Carlo method. The tiled FDTD kernel was multi-threaded and its performance with the tuned parameters was evaluated on multi-core processors. When compared with a naively implemented kernel, the performance of the tuned FDTD kernel was improved by more than a factor of two.
  • Masatoshi Kawai, Takeshi Iwashita, Hiroshi Nakashima
    HIGH PERFORMANCE COMPUTING FOR COMPUTATIONAL SCIENCE - VECPAR 2014 8969 57 - 65 2015年 [査読有り][通常論文]
     
    In this paper, we discuss an efficient implementation of the three-dimensional multigrid Poisson solver on a many-core coprocessor, Intel Xeon Phi. We have used the modified block red-black (mBRB) Gauss-Seidel (GS) smoother to achieve sufficient degree of parallelism and high cache hit ratio. We have vectorized (SIMDized) the GS steps in the smoother by introducing a partially SIMDizing technique based on loop splitting. Our numerical tests demonstrate that our implementation performs 35.5% better than the conventional mBRB-GS smoother implementation on Xeon Phi.
  • Akihiro Ida, Takeshi Iwashita, Takeshi Mifune, Yasuhito Takahashi
    Journal of Information Processing 22 4 642 - 650 2014年10月01日 [査読有り][通常論文]
     
    We discuss a scheme for hierarchical matrices with adaptive cross approximation on symmetric multiprocessing clusters. We propose a set of parallel algorithms that are applicable to hierarchical matrices. The proposed algorithms are implemented using the flat-MPI and hybrid MPI+OpenMP programming models. The performance of these implementations is evaluated using an electric field analysis computed on two symmetric multiprocessing cluster systems. Although the flat-MPI version gives better parallel scalability when constructing hierarchical matrices, the speed-up reaches a limit in the hierarchical matrix-vector multiplication. We succeeded in developing a hybrid MPI+OpenMP version to improve the parallel scalability. In numerical experiments, the hybrid version exhibits a better parallel speed-up for the hierarchical matrix-vector multiplication up to 256 cores.
  • 岡本吉史, 高橋康人, 藤原耕二, 阿波根明, 美舩健, 岩下武史
    電気学会論文誌 B 134 9 767 - 776 2014年 [査読有り][通常論文]
     
    The ICCG (Incomplete Cholesky decomposition Conjugate Gradient) method is widely applied to the electromagnetic field analysis using edge-based finite element method. The elapsed time of ICCG method holds the majority of electromagnetic field analysis. The main parts of ICCG method, which are composed of IC decomposition, forward-backward substitution and matrix-vector product, substantially influence the elapsed time. Therefore, the arrangement of reasonable implementations for main parts contributes to the realization of fast electromagnetic field computation in domestic research institutes. This paper presents the practical implementation of main components in ICCG method. Further, we make the meaning of diagonal scaling in ICCG method clear.
  • Performance Improvement of Three-Dimensional Tiled FDTD Kernel Based on Automatic Parameter Tuning
    Takeshi Minami, Motoharu Hibino, Tasuku Hiraishi, Takeshi Iwashita, Hiroshi Nakashima
    Proc. Intl. Conf. Computation on Electromagnetic Fields PC5-12 1 - 2 2013年07月 [査読有り][通常論文]
  • Kazuki Semba, Koji Tani, Takashi Yamada, Takeshi Iwashita, Yasuhito Takahashi, Hiroshi Nakashima
    IEEE TRANSACTIONS ON MAGNETICS 49 5 1581 - 1584 2013年05月 [査読有り][通常論文]
     
    We present a parallel multithreaded incomplete Cholesky-conjugate gradient (ICCG) solver for a linear system derived from a finite element electromagnetic field analysis. Algebraic block multicolor ordering is introduced to parallelize the solver with a high cache hit ratio and convergence comparable to the sequential solver. We develop the parallel ICCG solver based on reordering with modification for electromagnetic field analyses involving external circuits. The numerical results from practical models show that a 2.6- to 3.8-fold speedup compared with the sequential solver is attained using eight cores.
  • 仙波和樹, 山田隆, 岩下武史, 中島浩, 高橋康人, 美舩健
    電気学会論文誌 D 133 2 14 - 213 2013年 [査読有り][通常論文]
     
    In this paper, we discuss the solution of the linear system of equations derived from a finite element electromagnetic field simulation of a practical model in which the electromagnetic field is analyzed with effects of external circuits. To solve the linear system of equations efficiently, we introduce two preconditioning techniques recently proposed for Krylov subspace method. One is folded preconditioning and the other is A-phi block IC preconditioning. The A-phi block IC preconditioning is also one of folded preconditioning methods. Through practical simulation models, we examine these preconditioning techniques and confirm their effectiveness. Furthermore, we present a strategy for selecting the appropriate preconditioning technique, focusing on the magnitude of nonzero elements in non-diagonal blocks of the coefficient matrix. © 2013 The Institute of Electrical Engineers of Japan.
  • 南 武志, 岩下 武史, 中島 浩
    情報処理学会論文誌. コンピューティングシステム 6 1 56 - 65 一般社団法人情報処理学会 2013年01月 [査読有り][通常論文]
     
    本論文では高周波電磁場解析の一手法である 3 次元 FDTD 法におけるキャッシュメモリを考慮した性能改善手法の提案と性能評価を行う. 3 次元 FDTD 法の計算カーネルは時間発展に関するループにより与えられ,各タイムステップにおいて電場と磁場の値が交互に更新される. 3 次元 FDTD 法の計算カーネルは演算あたりのロード/ストア量が大きく,一般にメモリ帯域の影響を受けやすい計算である.キャッシュメモリのヒット率を向上させメインメモリへのアクセスによる性能の低下を軽減する性能改善手法として,解析領域をタイルと呼ぶ小領域に分割し各タイル内で複数のタイムステップに関する処理を連続して行うタイリングと呼ばれる手法が存在する.しかし,単純な固定タイルによる実装では,タイルの辺縁領域に対する冗長な計算がオーバヘッドとなっていた.そこで,本論文ではタイリング手法において,タイルの位置を時間ステップごとに変化させ計算量の増加を防ぐ手法を提案する.提案手法を評価した結果, AMD 製クアッドコア Opteron プロセッサよる数値実験において 4 スレッドによる並列処理を行った場合,一般的な 3 次元 FDTD 法の実装と比較して計算時間を約 50% 短縮させることに成功した.
  • Masatoshi Kawai, Takeshi Iwashita, Hiroshi Nakashima, Osni Marques
    HIGH PERFORMANCE COMPUTING FOR COMPUTATIONAL SCIENCE - VECPAR 2012 7851 292 - 299 2013年 [査読有り][通常論文]
     
    This paper describes parallelization techniques for a multigrid solver for finite difference analysis of three-dimensional Poisson equations. We first apply our block red-black ordering for parallelization of a Gauss-Seidel (GS) smoother, whose sequentiality is often problematic in parallelization of multigrid methods. Furthermore, we introduce a new multiplicative Schwarz smoother, in which multiple GS iterations are performed in each of red-black ordered blocks. Numerical tests are conducted on a cluster of multi-processor nodes comprising four quad-core AMD Opteron processors to examine the effectiveness of these parallel smoothers. The multi-process test using 216 processes in flat-MPI model shows that the block red-black GS smoother and its multiplicative Schwarz variant achieve 1.3 and 1.8 times better performance than the conventional red-black GS smoother, respectively.
  • K. Semba, K. Tani, T. Yamada, T. Iwashita, Y. Takahashi, H. Nakashima
    PIERS 2013 STOCKHOLM: PROGRESS IN ELECTROMAGNETICS RESEARCH SYMPOSIUM 979 - 983 2013年 [査読有り][通常論文]
     
    The performance of multithreaded incomplete Cholesky conjugate gradient solvers in finite element electromagnetic field analysis is analyzed. We compare the parallel performance of the additive Schwarztype incomplete Cholesky preconditioned conjugate gradient (AS-ICCG) solver and the parallelized incomplete Cholesky conjugate gradient solver using algebraic block multicolor ordering (ABMC-ICCG) on the latest processors. A numerical test of the interiorpermanent-magnet motor model analysis shows that the ABMC-ICCG solver has faster computation speed than the AS-ICCG solver in 16-core executions on an Intel (R) Xeon (R) E5 processor, and attains a 7.6-fold speedup relative to the sequential solver. Moreover, we analyze performance on an Intel (R) Xeon Phi (TM) coprocessor and attain a 35-fold speedup relative to the sequential solver on the same coprocessor using the ABMC-ICCG solver.
  • Multilingualization Based on RPC for Job-level Parallel Script Language, Xcrypt
    Masaru Ueno, Tasuku Hiraishi, Motoharu Hibino, Takeshi Iwashita, Horoshi Nakashima
    IPSJ Transactions on Programming 6 2 54 - 68 2013年 [査読有り][通常論文]
  • Yasuhito Takahashi, Tadashi Tokumasu, Masafumi Fujita, Takeshi Iwashita, Hiroshi Nakashima, Shinji Wakao, Koji Fujiwara
    IEEE Transactions on Magnetics 49 5 2413 - 2416 2013年 [査読有り][通常論文]
     
    This paper investigates the effectiveness of the time domain parallelization in magnetic field analyses of practical electric machines. We propose an efficient procedure to parallelize transient as well as steady-state analyses by generalizing the formulation of the parallel time-periodic finite element method. The proposed method is called the time domain parallel finite element method (TDPFEM) because it can be applied to both transient and steady-state analyses. Additionally, we derive a special condition of the slip to reduce computational costs for steady-state analyses of induction motors by using a half-cycle polyphase time-periodic condition. © 1965-2012 IEEE.
  • Junji Kitao, Yasuhito Takahashi, Koji Fujiwara, Takeshi Mifune, Takeshi Iwashita
    IEEE Transactions on Magnetics 49 5 1741 - 1744 2013年 [査読有り][通常論文]
     
    This paper describes new strategy for determining an optimal acceleration factor in the shifted incomplete Cholesky conjugate gradient (ICCG) method. Although a useful method focused on the maximum diagonal entry in the incomplete Cholesky (IC) preconditioner was already proposed, it cannot always provide the optimal acceleration factor. In this paper, we propose new automatic determination methods based on the minimization of the norms of the remainder matrix, the residual, and the functional in the shifted ICCG method and discuss its effectiveness in the 3-D electromagnetic field analyses using the edge-based finite element method. It is concluded that the proposed methods based on the minimization of the norm of the residual or the functional can determine an appropriate acceleration factor within the acceptable computational cost and improve the convergence property of the shifted ICCG method. © 1965-2012 IEEE.
  • 河合 直聡, 岩下 武史, 中島 浩
    情報処理学会論文誌 論文誌トランザクション 2012 1 1 - 10 情報処理学会 2012年10月 [査読有り][通常論文]
  • 合田 憲人, 東田 学, 坂根 栄作, 天野 浩文, 小林 克志, 棟朝 雅晴, 江川 隆輔, 建部修見, 鴨志田 良和, 滝澤 真一朗, 永井 亨, 岩下 武史, 石川 裕
    情報処理学会論文誌. コンピューティングシステム 5 5 90 - 102 一般社団法人情報処理学会 2012年10月 [査読有り][通常論文]
     
    本稿では,現在文部科学省により整備が進められている革新的ハイパフォーマンス・コンピューティング・インフラ (HPCI) のための認証基盤の設計について述べる.本認証基盤では,グリッド上の認証技術である Grid Security Infrastructure (GSI),および認証連携技術である Shibboleth を用いることにより, HPCI を構成する計算機や共用ストレージに対するシングルサインオンを実現する.本稿ではまた,本認証基盤の設計を検証するために構築した実験環境上での実証実験についても報告する.
  • Xcrypt in Lisp: A Scripting System for Job Level Parallel Programming in Lisp
    Tasuku Hiraishi, Masaru Ueno, Tatsuya Abe, Takeshi Iwashita, Hiroshi Nakashima
    Proc. Intl. Lisp Conf. 2012年10月 [査読有り][通常論文]
  • Takeshi Iwashita, Yu Hirotani, Takeshi Mifune, Toshio Murayama, Hideki Ohtani
    PARALLEL COMPUTING 38 9 485 - 500 2012年09月 [査読有り][通常論文]
     
    This paper reports on an investigation into large-scale parallel time-harmonic electromagnetic field analysis based on the finite element method. The parallel geometric multigrid preconditioned iterative solver for the resulting linear system was developed on a cluster of shared memory parallel computers. We propose a hybrid parallel ordering method for the parallelization of a multiplicative Schwarz smoother, which is a key component of the multigrid solver for electromagnetic field analysis. The method, using domain decomposition ordering for multi-process parallelism and introducing block multi-color ordering for multi-thread parallel processing, attains a high convergence rate with a small number of message passing interface communications and thread synchronizations. The numerical test confirms that the proposed method attains a solver performance more than twice as good as the conventional method based on multi-color ordering. Furthermore, an approximately 800 million degrees of freedom problem is successfully solved on 256 quad-core processors. (c) 2012 Elsevier B.V. All rights reserved.
  • Xcrypt: a Perl Extension for Job Level Parallel Programming
    Tasuku Hiraishi, Tatsuya Abe, Takeshi Iwashita, Hiroshi Nakashima
    Proc. Intl. WS. High-performance Infrastructure for Scalable Tools 2012年06月 [査読有り][通常論文]
  • ブロック化赤−黒順序付け法による並列マルチグリッドポアソンソルバ
    河合直聡, 岩下武史, 中島浩
    情報処理学会論文誌:コンピューティングシステム 5 3 1 - 10 2012年05月 [査読有り][通常論文]
  • Yasuhito Takahashi, Takeshi Iwashita, Hiroshi Nakashima, Tadashi Tokumasu, Masafumi Fujita, Shinji Wakao, Koji Fujiwara, Yoshiyuki Ishihara
    IEEE TRANSACTIONS ON MAGNETICS 48 2 1019 - 1022 2012年02月 [査読有り][通常論文]
     
    This paper investigates the parallelization of the time-periodic finite-element method in nonlinear magnetic field analyses of rotating machines. The developed method, which can obtain the steady state solutions directly, provides large granularity even in the small-scale problems compared with the ordinary parallel FEM based on the domain decomposition approach. Furthermore, we apply the parallel TPFEM to analyses of induction motors which have different time periodicities in stator and rotor regions due to the slip. Numerical results verify the effectiveness of the developed method.
  • Takeshi Iwashita, Hiroshi Nakashima, Yasuhito Takahashi
    2012 IEEE 26TH INTERNATIONAL PARALLEL AND DISTRIBUTED PROCESSING SYMPOSIUM (IPDPS) 474 - 483 2012年 [査読有り][通常論文]
     
    This paper covers the multi-threaded parallel processing of a sparse triangular solver for a linear system with a sparse coefficient matrix, focusing on its application to a parallel ICCG solver. We propose algebraic block multi-color ordering, which is an enhanced version of block multi-color ordering for general unstructured analysis. We present blocking and coloring strategies that achieve a high cache hit ratio and fast convergence. Five numerical tests on a shared memory parallel computer verify that the computation time of the proposed method is between 1.7 and 2.6 times faster than that of the conventional multi-color ordering method.
  • Yasuhito Takahashi, Takeshi Iwashita, Hiroshi Nakashima, Shinji Wakao, Koji Fujiwara, Yoshiyuki Ishihara
    IEEE TRANSACTIONS ON MAGNETICS 47 10 3805 - 3808 2011年10月 [査読有り][通常論文]
     
    This paper develops a parallel fast multipole method specialized for uniform brick elements to achieve large-scale micromagnetic simulations of a practical perpendicular recording head within acceptable computation time. In highly parallel computation, it is indispensable to equally distribute the computing load among processes so as to obtain the good parallel speedup. The load balancing technique which can be regarded as the domain decomposition method based on octree structure in the fast multipole method is discussed. The scalability of the parallel fast multipole accelerated micromagnetic simulation is investigated with 100 or more MPI processes.
  • Yasuhito Takahashi, Hiroyuki Kaimori, Akihisa Kameari, Tadashi Tokumasu, Masafumi Fujita, Shinji Wakao, Takeshi Iwashita, Koji Fujiwara, Yoshiyuki Ishihara
    IEEE TRANSACTIONS ON MAGNETICS 47 5 1422 - 1425 2011年05月 [査読有り][通常論文]
     
    This paper develops the time-periodic explicit error correction (TP-EEC) method for the convergence acceleration to a steady state in transient analysis of synchronous machines. The methods to deal with the movement of the rotor and different time-periodicity in the fixed and moving parts of the mesh are investigated. Furthermore, we propose the novel TP-EEC method based on the polyphase time periodic condition. Numerical results verify the effectiveness of the developed methods.
  • Y. Takahashi, T. Mifune, T. Iwashita, K. Fujiwara, Y. Ishihara
    IEEE Transactions on Magnetics 47 5 1342 - 1345 2011年05月 [査読有り][通常論文]
     
    This paper develops a folded preconditioning (FP) in quasi-static field analysis taking account of both tree-cotree and phi = 0 gauge conditions. We present an efficient procedure to compute the matrix-vector multiplication with respect to the auxiliary matrices required for the FP. Furthermore, we also construct the IC-based additive Schwarz type FP, which can achieve the further reduction of computation time and memory usage. Numerical results verify the effectiveness of the proposed methods.
  • 南 武志, 高橋 康人, 岩下 武史
    情報処理学会論文誌:コンピューティングシステム 4 2 70 - 83 2011年03月 [査読有り][通常論文]
  • M. Ohtani, K. Hirahara, Y. Takahashi, T. Hori, M. Hyodo, H. Nakashima, T. Iwashita
    PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON COMPUTATIONAL SCIENCE (ICCS) 4 1456 - 1465 2011年 [査読有り][通常論文]
     
    In quasi-dynamic earthquake cycle simulations based on rate and state friction laws, we applied the method of Hierarchical-Matrices (H-matrices) to multiplicative computations of the N x N slip response function matrix and the slip deficit rate vector, where N is the number of divided cells on the plate surface. H-matrices, which are efficient low-rank compressed representations of dense matrices, enable more rapid arithmetic operations with less memory sizes. In this study, we constructed a friction model of quasi-dynamic earthquake cycles on a flat, dipping, plate interface in a semi-infinite homogeneous elastic medium, and investigated the effectiveness of H-matrices by changing N from 10(4) to 10(6). Construction of H-matrices involves several parameters controlling the structure and accuracy of the approximated matrix. With H-matrices using proper values for these parameters to maintain accuracy, except for smaller values of the parameter for suppressing the ranks of the outermost submatrices, the memory size of the matrix was reduced to about O(N). The computational time in the multiplication was also reduced to O(N) for a range of N values less than about 10(5), and to O(N) similar to O(NlogN) for a larger range. Thus, we found that the application of H-matrices greatly reduces the computational time and memory size in earthquake cycle simulations. This advance should enable the realization of large-and multi-scale simulations with a million order cells and the estimation of frictional parameters.
  • 美舩健, 廣谷迪, 岩下武史, 村山敏夫, 大谷秀樹
    情報処理学会論文誌トランザクション(CD-ROM) 2010 1 ROMBUNNO.KONPYUTINGUSHISUTEMU,  2010年10月15日 [査読有り][通常論文]
  • 美舩 健, 廣谷 迪, 岩下 武史, 村山 敏夫, 大谷 秀樹
    情報処理学会論文誌. コンピューティングシステム 3 3 189 - 198 一般社団法人情報処理学会 2010年09月 [査読有り][通常論文]
     
    本論文では,マルチコアプロセッサシステム上における効率的な有限要素電磁界解析手法の開発を行う.有限要素法により導かれる連立一次方程式の解法として幾何マルチグリッド法を採用し,Arnold,Folk,Wintherのスムーザを並列化するため,ブロックマルチカラーオーダリングの一種と解釈できるオーダリング手法を提案した.数値実験により,オーダリングのブロックサイズと色数を適切に設定することで,良好な並列性能が得られることが示された.
  • 廣谷 迪, 美舩 健, 岩下 武史, 村山 敏夫, 大谷 秀樹
    電子情報通信学会論文誌. B, 通信 93 9 1331 - 1341 一般社団法人電子情報通信学会 2010年09月 [査読有り][通常論文]
     
    本論文では,1億自由度を超える大規模高周波電磁場問題に対する,幾何マルチグリッド法と分散並列処理を組み合わせた求解手法について述べる.電磁場有限要素解析におけるマルチグリッド法において用いられる"AFW(Arnold,Folk,Winther)スムーザ"は,本質的に並列化が困難な手法であり,並列化には特別な処置が必要となる.そこで筆者らは,差分解析等で用いられるマルチカラーオーダリング法の応用を検討し,並列化アルゴリズムの開発を進めてきた.しかしながら同手法は"反復解法の収束性"と"並列計算の粒度"にトレードオフの関係をもつため,並列計算環境下において収束性の改善が困難となる問題がある.そこで本論文では,本トレードオフ問題を解消し,更なる解析の高速化を図るため,領域分割型オーダリングとブロック化マルチカラーオーダリングの併用手法を新たに提案し,SMPクラスタ型並列計算機Fujitsu SPARC Enterprise M9000による数値実験によりその有効性を検証した.その結果,約1億7000万自由度の問題について,マルチカラーオーダリングのみを用いた場合と比較して計算時間を約1/3まで短縮することに成功したほか,約8億自由度の問題を16分程度で求解することを可能とした.
  • Yasuhito Takahashi, Tadashi Tokumasu, Akihisa Kameari, Hiroyuki Kaimori, Masafumi Fujita, Takeshi Iwashita, Shinji Wakao
    IEEE TRANSACTIONS ON MAGNETICS 46 8 2947 - 2950 2010年08月 [査読有り][通常論文]
     
    This paper proposes a novel method for the improvement of the convergence to a steady state in time-periodic transient nonlinear eddy-current analyses. The proposed method, which is based on the time-periodic finite element method and the singularity decomposition-explicit error correction method, can extract poorly converged error components corresponding to the large time constants of an analyzed system. The correction of the extracted error components efficiently accelerates the convergence to a steady state. Numerical results verify the effectiveness of the proposed method.
  • Takeshi Mifune, Yasuhito Takahashi, Takeshi Iwashita
    IEEE TRANSACTIONS ON MAGNETICS 46 7 2579 - 2584 2010年07月 [査読有り][通常論文]
     
    Magnetostatic edge-element formulation leads to a singular linear system of equations. Although a reduced system of equations can be derived by imposing the zero-tree gauge condition, the gauging causes undesirable deterioration in the convergence property of conventional iterative solvers. In this paper, we develop a new preconditioning technique that overcomes the slow convergence caused by zero-tree gauging, by utilizing the folded preconditioning proposed in our previous paper. Moreover, we present a novel theorem that clarifies the coincidence of the spectra of the preconditioned matrices when folded preconditioning is used.
  • 柔軟かつ直観的な記述が可能なジョブ並列スクリプト言語Xcrypt
    平石拓, 安部達也, 三宅洋平, 岩下武史, 中島浩
    先端的計算基盤システムシンポジウムSACSIS 2010 2010年05月 [査読有り][通常論文]
  • 高橋 康人, 岩下 武史, 中島 浩, 若尾 真治
    情報処理学会論文誌. コンピューティングシステム 3 1 101 - 111 一般社団法人情報処理学会 2010年03月16日 [査読無し][通常論文]
     
    高速多重極法 (FMM) を導入したマイクロマグネティックス計算の大規模高速化を目的として,MPI を用いた並列化および負荷分散法について検討を行う.マイクロマグネティックスで用いられる均一な要素分割の周期性を活用し演算量を大幅に削減できる直方体要素用 FMM において,その特長を保持したまま適切な負荷分散を行う方法を提案するとともに,100 プロセス以上の並列計算における台数効果について検証する.最終的に,垂直記録用単磁極磁気ヘッドの記録磁界解析に適用し,複雑形状を有する実機を対象とした大規模解析における開発手法の有効性を明らかにする.
  • 岩下 武史, 美舩 健, 高橋 康人
    応用数理 20 1 12 - 24 一般社団法人日本応用数理学会 2010年03月 [査読有り][招待有り]
     
    This paper introduces three techniques that the authors have recently proposed in the area of iterative solvers. The first is a new framework of an explicit and implicit error correction method for error correction in linear iterative solvers. The second technique is folded preconditioning, a technique based on an important theorem about Krylov subspace methods applied to a singular linear system. This technique can reduce redundant unknowns of a singular linear system without any degradation of convergence. The third is A-phi block preconditioning. This technique is a type of folded preconditioning and is specially designed for finite element electromagnetic field analyses. A numerical test confirms that the proposed method reduces computational time for a high-frequency electromagnetic field problem by 45%.
  • 直方体要素用高速多重極法を用いた大規模マイクロマグネティックス計算の並列化
    髙橋康人, 岩下武史, 中島浩, 若尾真治
    情報処理学会論文誌 コンピューティングシステム 3 1 101 - 111 2010年03月 [査読有り][通常論文]
  • Yasuhito Takahashi, Takeshi Iwashita, Hiroshi Nakashima, Shinji Wakao, Koji Fujiwara, Yoshiyuki Ishihara
    Digests of the 2010 14th Biennial IEEE Conference on Electromagnetic Field Computation, CEFC 2010 2010年 [査読有り][通常論文]
     
    This paper investigates the scalability of a parallel fast multipole accelerated boundary integral equation method in electrostatic field analyses. A load balancing technique suitable for highly parallel computation with 100 or more processes is also proposed. Numerical results clarify the effectiveness of the developed method in practical models with complicated geometry. © 2010 IEEE.
  • Numerical analysis of Transient Stability Control of Diagonal Type MHD Generator Connected to Power Network(共著)
    I. Inoue, Y. Inui, T. Iwashita, M. Ishikawa
    Proc. 17th Int. Conf. on MHD Energy Conversion 0 0 2-1(1) - 2-1(7) International Liaison Group on MHD Energy Conversion 2009年09月14日 [査読無し][通常論文]
  • 高橋 康人, 徳増 正, 藤田 真史, 若尾 真治, 岩下 武史, 金澤 正憲
    電気学会論文誌. B, 電力・エネルギー部門誌 = The transactions of the Institute of Electrical Engineers of Japan. B, A publication of Power and Energy Society 129 6 791 - 798 電気学会 2009年06月 [査読有り][通常論文]
     
    This paper proposes novel techniques for the improvement of the convergence characteristic of step-by-step time integrations in nonlinear transient eddy-current analyses. The proposed methods, which are based on the time-periodic finite-element method and the explicit error correction method, can extract poorly-converged error components corresponding to large time constants of an analyzed system. The correction of the extracted error components accelerates the convergence of transient calculation efficiently. Furthermore, we extend the performance of the proposed methods in nonlinear problems. Some numerical results that verify the effectiveness of the proposed methods are also presented.
  • Takeshi Mifune, Yasuhito Takahashi, Takeshi Iwashita
    IEEE TRANSACTIONS ON MAGNETICS 45 5 2068 - 2075 2009年05月 [査読有り][通常論文]
     
    The A-phi formulation, which is widely used in electromagnetic analysis, leads to a redundant linear system of equations that includes a substantial number of redundant degrees of freedom (DOF). We can derive a redundancy-reduced linear system of equations by eliminating the redundant DOF, thereby decreasing the computation costs per iteration for iterative solvers, such as the incomplete Cholesky conjugate gradient (ICCG) solver. This does not, however, result in a reduction in total computation time, due to significant convergence deterioration. In this paper, we present a solution to this problem in the form of folded preconditioners. First, the theorem presented reveals that, for any preconditioned Krylov subspace method for the original redundant linear systems, we can derive the equivalent Krylov subspace method for the redundancy-reduced linear systems by using the corresponding folded preconditioner. As an uncomplicated example, the standard ICCG solver for the original redundant systems has exactly the same convergence property as the CG solver for the redundancy-reduced systems using the folded variant of the IC preconditioner (the folded IC preconditioner). Furthermore, we discuss efficient computational procedures for the folded preconditioners and the design of Krylov subspace algorithms using the preconditioners. A sample full-wave analysis demonstrates the good performance of a newly developed solver, the conjugate orthogonal conjugate gradient (COCG) method with the folded IC preconditioner. The new solver not only lowers the computation costs per iteration by reducing the number of DOF, but also completely avoids the convergence deterioration.
  • Y. Takahashi, S. Wakao, T. Iwashita, M. Kanazawa
    JOURNAL OF APPLIED PHYSICS 105 7 514  2009年04月 [査読有り][通常論文]
     
    This paper describes a large-scale micromagnetic simulation by using the fast multipole method (FMM) specialized for uniform brick elements. The fast Fourier transform (FFT) is widely used to reduce computational costs of the demagnetizing field calculation. However, the FFT still requires operation counts of O(N log N), where N is the number of elements, which results in the huge computational costs in large-scale problems. To overcome the difficulties, we develop an O(N) approach based on the FMM. In a micromagnetic simulation, an analyzed region is usually subdivided into uniform elements. By making the best use of the periodic structure of uniformly distributed elements, the computational costs of the FMM can be reduced drastically. A large-scale micromagnetic simulation of a single-pole-type head demonstrates the effectiveness of the specialized FMM from the viewpoints of calculation time and memory requirements, compared with the FFT. (C) 2009 American Institute of Physics. [DOI: 10.1063/1.3068012]
  • T. Iwashita, T. Mifune, S. Moriguchi, M. Shimasaki
    IEEE Transactions on Magnetics 45 3 1424 - 1427 2009年03月 [査読有り][通常論文]
  • Takeshi Mifune, Soichl Moriguchi, Takeshi Iwashita, Masaaki Shimasaki
    IEEE TRANSACTIONS ON MAGNETICS 45 3 1104 - 1107 2009年03月 [査読有り][通常論文]
     
    Our previous paper proposed two frameworks for iterative linear solvers: the implicit and explicit error correction methods. In this paper, we discuss the convergence property of these methods. A formula we derive explains the reasonability of the auxiliary matrix that Kameari suggested for thin elements. Additionally, an enhanced auxiliary matrix is devised for thin elements, in which the material property changes discontinuously.
  • Developing a Parallelized Matrix Solver of the Residual Cutting Method by using AMG as an Inner Solver
    Y.Matsuo, T.Iwashita, K.Taniguchi, A.Ida
    Transactions of JSCES 2009年 [査読有り][通常論文]
  • Takeshi Iwashita, Takeshi Mifune, Masaaki Shimasaki
    IEEE Transaction on Magnetics 44 6 946 - 949 2008年06月 [査読有り][通常論文]
     
    This paper proposes an implicit error correction method that corresponds to the explicit error correction methods, such as Hiptmair's hybrid smoother and the conventional multigrid method. The A-phi method can be seen as the implicit error correction method corresponding to the hybrid smoother. Numerical tests confirm that the A-phi method produces a similar correction effect on the error belonging to the kernel of the discrete curl operator as that of the hybrid smoother. Furthermore, this paper introduces an implicit correction multigrid method, which is the implicit error correction version of the conventional multigrid method. In this method, linear systems on all levels in a multigrid method are combined into a large linear system. This linear system is solved by an iterative solver, and any preconditioning techniques can be used. Numerical tests show that the proposed method involves coarse grid correction effects and achieves a convergence rate independent of the grid-size, thus confirming the effectiveness of the implicit error correction method.
  • Takeshi Iwashita, Masaaki Shimasaki
    HIGH-PERFORMANCE COMPUTING 4759 164 - + 2008年 [査読有り][通常論文]
     
    In Incomplete LU (ILU) preconditioning, orderings often affect the effect of preconditioning. The authors recently proposed a simple evaluation way for orderings in the ILU preconditioning technique. The present paper introduces the evaluation method in unstructured analyses in which the effect of preconditioning is not easily estimated. The evaluation index, which has a simple relationship with the matrix norm of the remainder matrix, is easily computed without additional memory requirement. The computational cost of the index is trivial in the total iterative solution process. The effectiveness of the method is examined by numerical tests using coefficient matrix data from the Matrix Market, a finite-difference analysis of Poisson equation, and a 3-d electromagnetic field analysis.
  • 用水 邦明, 岩下 武史, 森 倫也, 小林 英一
    電気学会論文誌. B, 電力・エネルギー部門誌 = The transactions of the Institute of Electrical Engineers of Japan. B, A publication of Power and Energy Society 127 8 911 - 917 電気学会 2007年08月 [査読有り][通常論文]
     
    Finite element analyses of electromagnetic field are commonly used for designing of various electronic devices. The scale of the analyses becomes larger and larger, therefore, a fast linear solver is needed to solve linear equations arising from the finite element method. Since a multigrid solver is the fastest linear solver for these problems, parallelization of a multigrid solver is a quite useful approach. From the viewpoint of industrial applications, an effective usage of a small-scale PC cluster is important due to initial cost for introducing parallel computers.In this paper, a distributed parallel multigrid solver for a small-scale PC cluster is developed. In high frequency electromagnetic field analyses, a special block Gauss-Seidel smoother is used for the multigrid solver instead of general smoothers such as Gauss-Seidel smoother or Jacobi smoother in order to improve a convergence rate. The block multicolor ordering technique is applied to parallelize the smoother. A numerical exsample shows that a 3.7-fold speed-up in computational time and a 3.0-fold increase in the scale of the analysis were attained when the number of CPU was increased from one to five.
  • T. Iwashita, M. Shimasaki, J. Lu
    APPLIED COMPUTATIONAL ELECTROMAGNETICS SOCIETY JOURNAL 22 2 195 - 200 2007年07月 [査読有り][通常論文]
     
    This paper investigates fast electromagnetic field analysis on parallel computers mutually integrated by means of Grid computing technology. To utilize the heterogeneous parallel computation environment, we introduce four Parallelized ICCG solvers: the block ICCG, load-balanced block ICCG, algebraic block red-black ordering, and recursive reordering methods. These solvers are evaluated in a finite edge-element eddy-current analysis on integrated parallel computers.
  • Takeshi Iwashita, Takeshi Mifune, Masaaki Shimasaki
    IEEE Transaction on Magnetics 43 4 1493 - 1496 2007年04月 [査読無し][通常論文]
     
    This paper introduces a simple way to evaluate the preconditioning effect in the shifted ICCG method. The proposed evaluation index is easily calculated with little additional memory in an incomplete factorization process; thus, it can be used for setting appropriate parameters for the solver, such as an acceleration factor and the ordering of unknowns, prior to the time-consuming iteration process. Numerical results show that the evaluation index gives the good estimate of the number of iterations necessary for convergence.
  • T. Mifune, T. Iwashita, M. Shimasaki
    IEEE Transactions on Magnetics 43 4 1481 - 1484 2007年04月 [査読有り][通常論文]
  • ダイアゴナル型MHD発電機の電力系統連系時における安定制御の研究(共著)
    井上 勲, 乾 義尚, 岩下武史, 石川本雄
    第2回新エネルギー技術シンポジウム 0 0 CD-ROM - CD-ROM 産業技術総合研究所 2007年03月09日 [査読無し][通常論文]
  • 森 倫也, 用水 邦明, 岩下 武史, 小林 英一, 阿部 眞
    電子情報通信学会論文誌. C, エレクトロニクス 89 8 521 - 528 一般社団法人電子情報通信学会 2006年08月01日 [査読無し][通常論文]
     
    電子部品の設計に用いる高周波電磁界有限要素解析では,対象部品の構造の複雑化に伴い,解くべき連立一次方程式の元数が増大する傾向にある.大規模な連立一次方程式の求解方法として,使用メモリ量の観点から反復法の適用が望ましいと考えられるが,同解析において生ずる連立一次方程式は一般に反復法における収束性が良好でないことが知られている.そこで本論文では,反復法における収束性の改善手法である前処理手法について,ILU分解前処理などの従来の前処理に代わる高周波電磁界解析向けの前処理について検討を行った.その結果,マルチグリッド法においてArnold, Falk, Wintherらが提案した特殊なSmoother,及びHiptmairによるHybrid smootherを反復法の前処理として利用することを考えた.本論文ではこれらの手法の詳細を述べ,三次元高周波電磁界解析による数値実験によりその有効性を検証する.
  • T Mifune, S Isozaki, T Iwashita, M Shimasaki
    IEEE TRANSACTIONS ON MAGNETICS 42 4 635 - 638 2006年04月 [査読無し][通常論文]
     
    Most computation costs in magnetic finite-element analyses are consumed solving large-scale linear systems of equations; therefore, the development of fast linear solvers would be effective to reduce the computation time. This research is aimed to develop an efficient algebraic multigrid (AMG) preconditioner for three-dimensional (3-D) magnetic finite-element analyses utilizing nodal and edge elements. A new AMG preconditioner for eddy-current analyses is proposed, which separately treats nodal elements and edge elements in the construction of the coarse grids. Numerical results demonstrated the performances of AMG solvers in magnetostatic analyses and eddy-current analyses. The proposed AMG preconditioner achieves a better convergence than a conventional one in eddy-current analyses.
  • Shimayoshi Takao, Komurasaki Kazuhiro, Amano Akira, Iwashita Takeshi, Matsuda Tetsuya, Kanazawa Masanori
    IPSJ Digital Courier 2 2 726 - 735 一般社団法人 情報処理学会 2006年 [査読無し][通常論文]
     
    The development of physiological cell models to support the understanding of biological mechanisms gains increasingly importance. Due to the complexity of biological systems, whole cell models, which are composed of many imported component models of functional elements, get quite complex, making modifications difficult. Here, we propose a method to enhance structural changes of cell models, employing the markup languages of CellML and our original PMSML (Physiological Model Structure Markup Language), in addition to a new ontology for cell physiological modelling, the Cell Model Ontology. In particular, a method to make references from CellML files to the ontology and a method to assist with manipulation of model structures using PMSML together with the Cell Model Ontology are reported. Using these methods two software utilities, an interactive ontology ID assigner, the CellML Ontologizer, and a graphical cell model editor, the Cell Structure Editor, are implemented. Experimental results proved that the proposed method and the implemented software are useful for the modification of physiological models.
  • Takao Shimayoshi, Kazuhiro Komurasaki, Akira Amano, Takeshi Iwashita, Masanori Kanazawa, Tetsuya Matsuda
    2006 28TH ANNUAL INTERNATIONAL CONFERENCE OF THE IEEE ENGINEERING IN MEDICINE AND BIOLOGY SOCIETY, VOLS 1-15 1 4525 - + 2006年 [査読有り][通常論文]
     
    The development of electrophysiological whole cell models to support the understanding of biological mechanisms is increasing rapidly. Due to the complexity of biological systems, comprehensive cell models, which are composed of many imported sub-models of functional elements, can get quite complicated as well, making computer modification difficult. Here, we propose a computer support to enhance structural changes of cell models, employing the markup languages CellML and our original PMSML (Physiological Model Structure Markup Language), in addition to a new ontology for cell physiological modelling. In particular, a method to make references from CellML files to the ontology and a method to assist manipulation of model structures using markup languages together with the ontology are reported. Using these methods three software utilities, including a graphical model editor, are implemented. Experimental results proved that these methods are effective for the modification of electrophysiological models.
  • J Nonaka, N Kukimoto, Y Ebara, M Ogata, T Iwashita, M Kanazawa, K Koyamada
    IEICE Trans. Inf. & Syst E88D 11 2582 - 2590 2005年11月 [査読無し][通常論文]
     
    Volume Graphics Clusters (VG Clusters) have proven to be efficient in a wide range of visualization applications and have also shown promise in some other applications where the image composition device could be fully utilized. The main differentiating feature from other graphics clusters is a specialized image composition device, commercially available as the MPC Image Compositor, which enables the building of do-it-yourself VG Clusters. Although this device is highly scalable, the unidirectional composition flow limits the data subdivision to the quantity of physically available rendering nodes. In addition, the limited buffer memory limits the maximum capable image composition size, therefore limiting its use in large-scale data visualization and high-resolution visualization. To overcome these limitations, we propose and evaluate an image composition mechanism in which additional hardware is used for assisting the image composition process. Because of the synergistic use of two distinct image composition hardware devices we named it "Hybrid Image Composition". Some encouraging results were obtained showing the effectiveness of this solution in improving the VG Cluster 's potential. A low-cost parallel port based hardware barrier is also presented as an efficient method for further enhancing this kind of small-scale VG Cluster. Moreover, this solution has proven to be especially useful in clusters built using low-speed networks, such as Fast Ethernet, which are still in common use.
  • J Nonaka, N Kukimoto, Y Ebara, M Ogata, T Iwashita, M Kanazawa, K Koyamada
    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E88D 11 2582 - 2590 2005年11月 [査読有り][通常論文]
     
    Volume Graphics Clusters (VG Clusters) have proven to be efficient in a wide range of visualization applications and have also shown promise in some other applications where the image composition device could be fully utilized. The main differentiating feature from other graphics clusters is a specialized image composition device, commercially available as the MPC Image Compositor, which enables the building of do-it-yourself VG Clusters. Although this device is highly scalable, the unidirectional composition flow limits the data subdivision to the quantity of physically available rendering nodes. In addition, the limited buffer memory limits the maximum capable image composition size, therefore limiting its use in large-scale data visualization and high-resolution visualization. To overcome these limitations, we propose and evaluate an image composition mechanism in which additional hardware is used for assisting the image composition process. Because of the synergistic use of two distinct image composition hardware devices we named it "Hybrid Image Composition". Some encouraging results were obtained showing the effectiveness of this solution in improving the VG Cluster 's potential. A low-cost parallel port based hardware barrier is also presented as an efficient method for further enhancing this kind of small-scale VG Cluster. Moreover, this solution has proven to be especially useful in clusters built using low-speed networks, such as Fast Ethernet, which are still in common use.
  • T Mifune, T Iwashita, M Shimasaki
    IEEE Transaction on Magnetics 41 5 1660 - 1663 2005年05月 [査読無し][通常論文]
     
    This paper presents a parallel algebraic multigrid (AMG) solver for linear systems of equations arising in magnetic finite edge-element analyses. To parallelize the smoothing process, which consumes most of the computational costs of the AMG algorithm, we apply multicolor (MC) ordering to the symmetric Gauss-Seidel (SGS) method. Advantages of MC ordering are: 1) that the number of processors employed does not affect the convergence of the approximate solution and 2) that only the information of the coefficient matrix is utilized to parallelize the smoother. The numerical results show that the developed solver achieves sufficient scalability in magnetic finite edge-element analyses.
  • Journal of IIEEJ Vol. 34,No.3, pp.245-255 2005年 [査読無し][通常論文]
  • Takeshi Mifune, N. Obata, Takeshi Iwashita, Masaaki Shimasaki
    Parallel Computing: Current & Future Issues of High-End Computing, Proceedings of the International Conference ParCo 2005, 13-16 September 2005, Department of Computer Architecture, University of Malaga, Spain 237 - 244 Central Institute for Applied Mathematics, Jülich, Germany 2005年 [査読有り][通常論文]
  • T Iwashita, Y Nakanishi, M Shimasaki
    SIAM JOURNAL ON SCIENTIFIC COMPUTING 26 4 1234 - 1260 2005年 [査読有り][通常論文]
     
    This paper introduces block red-black ordering in a general three-dimensional form for parallel incomplete LU (ILU) preconditioning. This parallel ordering method is designed to attain fast convergence with reduced synchronization among processors in parallelized forward and backward substitutions. In this method, the grid-nodes are divided into blocks and red-black ordering is applied to them. Since blocks with identical colors never have a data-dependency, the blocks in each color can be processed in parallel. Moreover, in order to compare parallel orderings, we propose a new tool for investigating orderings on convergence. The analytic index for convergence, which is based on the remainder matrix, is easily computed and has a unique value for a fixed ordering. Nodes are classified into seven groups, and the effect of each group on convergence is estimated. Numerical tests using a three-dimensional problem confirm the validity of both proposed parallel ordering and analytic convergence comparison methods.
  • T Iwashita, M Shimasaki, JW Lu
    2005 IEEE/ACES International Conference on Wireless Communications and Applied Computational Electromagnetics 654 - 657 2005年 [査読有り][通常論文]
     
    This paper investigates fast electromagnetic field analysis on parallel computers mutually integrated by means of Grid computing technology. To utilize the heterogeneous parallel computation environment, we introduce four parallelized ICCG solvers: the block ICCG, load-balanced block ICCG, algebraic block red-black ordering, and recursive reordering methods. These solvers are evaluated in a finite edge-element eddy-current analysis on integrated parallel computers.
  • “HybridImageCompositionMechanism forEnhancingVolumeGraphicsCluster
    Jorji Nonaka, Nobuyuki Kukimoto, Yasuo Ebara, Masato Ogata, Takeshi Iwashita, Masanori Kanazawa, Koji Koyamada
    IEICE Trans.Inf.& Syst.,Vol.E88-D,No.11,pp.2582-2590. 2005 2005年 [査読有り][通常論文]
  • 岩下 武史, 中西 佑一, 島崎 眞昭
    電気学会論文誌. C, 電子・情報・システム部門誌 = The transactions of the Institute of Electrical Engineers of Japan. C, A publication of Electronics, Information and System Society 124 2 526 - 532 電気学会 2004年 [査読無し][通常論文]
     
    The present paper deals with parallelization of ICCG method. A reordering (parallel ordering) technique is one of typical parallel processing techniques of ICCG method. While several parallel orderings have been proposed, the block red-black ordering that is proposed by the authors is relatively new ordering. This ordering method has advantages in convergence rate and in synchronization costs, and its effectiveness was confirmed in a preliminary numerical test for 2-d finite difference analyses. In the present paper, this method is enhanced for 3-d finite difference analyses, which require more computational efforts than 2-d analyses. We here describe the details of the implementation procedure of the block red-black ordering in 3-d analyses. Numerical tests for a 3-d partial differential equation problem are performed. It is shown that 3-d block red-black ordering method attains high parallel efficiency due to fast convergence and effective use of data cache.
  • T Iwashita, M Shimasaki
    IEEE Transaction on Magnetics 39 3 1713 - 1716 2003年05月 [査読無し][通常論文]
     
    This paper proposes a new parallelized incomplete Cholesky conjugate gradient (ICCG) solver effective on a small-scale multiprocessor system. The new method is based on a new reordering technique, namely the block red-black ordering method. Its parallel performance is evaluated in a finite edge-element eddy-current analysis. A numerical test shows that the proposed method is effective on a small, number of processors due to fast convergence and low communication costs.
  • T Mifune, Iwashita, I, M Shimasaki
    IEEE Transaction on Magnetics 39 3 1677 - 1680 2003年05月 [査読無し][通常論文]
     
    The algebraic multigrid (AMG) method is an algebraic multilevel solver for linear systems of equations, which stem from the discretization of partial differential equations. This paper develops an efficient AMG solver for singular linear systems of equations arising from electromagnetic finite element (FE) analyses using edge elements. The presented solver can solve singular equations using a technique similar to the shifted incomplete Cholesky conjugate gradient method.. Shifted global coefficient matrices. are utilized to construct the AMG preconditioner. The numerical results show that the proposed AMG conjugate gradient (AMGCG) solver can converge with a wide range of "shift.".
  • T Iwashita, M Shimasaki
    INTERNATIONAL JOURNAL OF PARALLEL PROGRAMMING 31 1 55 - 75 2003年02月 [査読有り][通常論文]
     
    A parallel ordering technique is a typical strategy for parallelization of the ICCG method. This paper proposes a new parallel ordering method to develop a parallel ICCG solver utilizing fewer synchronization points and achieving a high convergence rate. The new parallel ordering is called "block red-black ordering". In this method, nodes in an analyzed grid are divided into several or many blocks, and red-black ordering is applied to the blocks. Since the blocks with an identical color are independent of each other, forward and backward substitutions in the ICCG iteration can be parallelized in each color. The new method has the advantage that only one synchronization point exists in each parallelized substitution. In order to evaluate the convergence and the parallel speed-up of the method, we carried out an analytical investigation using the ordering graph theory and numerical tests on a scalar parallel computer. The analytical study shows that the convergence rate is improved by an increase in the number of nodes of one block and that an optimal block size for getting the best convergence rate is easily set. The numerical tests show that the new method achieves a high parallel speed-up rate due to fast convergence, small synchronization costs, and effective utilization of the data cache on a scalar parallel computer.
  • K Kawase, M Kawahara, T Iwashita, H Kawano, M Kawazawa
    DATA WAREHOUSING AND KNOWLEDGE DISCOVERY, PROCEEDINGS 2737 151 - 160 2003年 [査読有り][通常論文]
     
    The study of the authoritative pages and community discovery from an enormous Web contents has attracted many researchers. One of the link-based analysis, the HITS algorithm, calculates authority scores as the eigenvector of a adjacency matrix created from the Web graph. Although it was considered impossible to compute the eigenvector of a very large scale of Web graph using previous techniques, due to this calculation requires enormous memory space. We make it possible using data compression and parallel computation.
  • M Shimasaki, T Iwashita, T Mifune
    Journal of Computational and Applied Mathematics 149 1 341 - 349 2002年12月 [査読無し][通常論文]
     
    Solving linear equations plays a crucial role in high performance electromagnetic field analysis. We describe forms and characteristics of a system of linear equations arising in electromagnetic field analysis with finite element method (FEM). Properties of ICCG and its parallelization are discussed in context of electromagnetic field analyses. Although current applicability of multigrid approach is rather limited in electromagnetic field analysis in comparison with ICCG, the multigrid method is important because it is quite fast when applied to very large-scale problems. We discuss the algebraic multigrid method in finite element electromagnetic field analysis. (C) 2002 Elsevier Science B.V. All rights reserved.
  • 美舩 健, 岩下 武史, 島崎 眞昭
    日本応用数理学会論文誌 12 2 169 - 188 一般社団法人日本応用数理学会 2002年06月15日 [査読無し][通常論文]
     
    The algebraic multigrid (AMG) method is known as a robust solver for the linear system of equations with positive definite symmetric M-matrix. In this paper, it is proved that we can transfer the given H-matrix problem to a M-matrix problem and that all results as to the convergence of the AMG method for M-matrices also hold for H-matrices. We construct a new interpolation operator, which works well for positive definite symmetric H-matrix equations. Numerical experiments are also performed, and the results show that the proposed AMG algorithm is an efficient solver for systems with matrices, which include positive off-diagonal entries.
  • T Mifune, T Iwashita, M Shimasaki
    IEEE Transaction on Magnetics 38 2 369 - 372 2002年03月 [査読無し][通常論文]
     
    The algebraic multigrid (AMG) method is an efficient solver for linear systems arising in finite element analyses. The AMG method is applicable at a matrix level, different from the geometric multigrid solvers. This paper proposes a combination of the parallel processing technique and the AMG method as a fast solver for electromagnetic field analyses. While the AMG method consists of a setup phase and a solution phase, parallel processing of the former phase is difficult. We present the use of long-range interpolation instead of the conventional direct interpolation for improvement of the parallel efficiency of the AMG setup phase. A magnetostatic analysis and an eddy-current analysis show the solver performance. The numerical results show that parallelized AMG is a fast solver and has sufficient scalability, as compared with the conventional solver.
  • Takeshi Iwashita, Masaaki Shimasaki
    IEEE Transaction on Magnetics 38 2 I 429 - 432 2002年03月 [査読無し][通常論文]
     
    This paper proposes a new black-box-type parallel processing method for the incomplete Cholesky conjugate gradient (ICCG) solver. The new method is based on a multicolor ordering concept and an automatic reordering process in the solver. Parallel performance is evaluated in the context of three-dimensional finite edge-element eddy-current analysis. The proposed method attains high parallelism with a small increase in CG iterations and achieves high parallel performance.
  • 同期点の少ない並列化ICCG法のためのブロック化赤-黒順序付け(共著)
    情報処理学会論文誌 43 4 893 - 904 2002年 [査読無し][通常論文]
  • T Iwashita, T Tami, M Kanazawa
    PAR ELEC 2002: INTERNATIONAL CONFERENCE ON PARALLEL COMPUTING IN ELECTRICAL ENGINEERING 293 - 298 2002年 [査読有り][通常論文]
     
    The present paper proposes a new black-box parallelized ILU-BiCGSTAB solver. The new method is based on a multi-color ordering concept and an automatic reordering process in the solver. The new solver attains high parallelism with a small increase in iterations and achieves high parallel performance.
  • Takeshi Iwashita, Masaaki Shimasaki
    Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2327 175 - 189 2002年 [査読有り][通常論文]
     
    The present paper proposes a new parallel ordering, "block red-black ordering," for a parallelized ICCG solver with fewer synchronization points and a high convergence rate. In the new method, nodes in an analyzed grid are divided into several or many blocks, and red-black ordering is applied to the blocks. Several blocks are assigned to each processor and the substitution is carried out in parallel. Only one synchronization point exists in each parallelized substitution. We performed an analytical investigation using the ordering graph theory and computational tests on a scalar parallel computer. These results show that a convergence rate is improved by an increase in the number of nodes of one block and that a high parallel performance is attained by using an appropriate block size. © 2002 Springer Berlin Heidelberg.
  • T Iwashita, M Shimasaki
    IEEE Transaction on Magnetics 37 5 3498 - 3502 2001年09月 [査読無し][通常論文]
     
    The present paper proposes a new method for the construction and ordering of edge elements for parallel computation. The use of virtual nodes generated in each volume element is presented as a means of introducing parallel ordering theory developed in finite difference analyses to finite edge element analyses. Eight-corner ordering and multi-color ordering are examined in the context of 3-D eddy-current analysis. The proposed method using 8-corner ordering can parallelize the ICCG solver in a finite edge element analysis without decreasing the convergence rate. A good balance between convergence and parallelism in the ICCG solver is obtained in the case of multi-color ordering.
  • T Iwashita, T Matsuo, Y Inui, M Ishikawa, J Umoto
    ELECTRICAL ENGINEERING IN JAPAN 136 1 29 - 36 2001年07月 [査読有り][通常論文]
  • T Iwashita, M Shimasaki
    IEEE Transaction on Magnetics 36 4 1504 - 1509 2000年07月 [査読無し][通常論文]
     
    A new parallelized ICCG scheme is applied to a finite edge element analysis of a 3-d eddy current problem with a moving conductor, In the new method, the global matrix is automatically reordered to the matrix form appropriate to parallel processing. The method requires no particular pre-processing step. It is shown that the newly proposed method has a better parallel efficiency than the Block ICCG method because of a higher preconditioning effect.
  • 岩下 武史, 松尾 哲司, 乾 義尚, 石川 本雄, 卯本 重郎
    電気学会論文誌. B, 電力・エネルギー部門誌 = The transactions of the Institute of Electrical Engineers of Japan. B, A publication of Power and Energy Society 120 3 426 - 432 電気学会 2000年03月01日 [査読無し][通常論文]
  • T Iwashita, T Mifune, R Sokabe, M Shimasaki
    INTERNATIONAL CONFERENCE ON PARALLEL COMPUTING IN ELECTRICAL ENGINEERING - PARELEC 2000, PROCEEDINGS 203 - 207 2000年 [査読有り][通常論文]
     
    3-D Eddy current analyses are performed with parallelized ICCG solvers. In order to parallelize the ICCG solver, the present analysis uses the Block ICCG method (BICCG) and the Parallelized ICCG method with renumbering process (PICCG-RP) that is proposed by the authors. In the latter method, the global matrix is reordered to the matrix form appropriate to parallel processing. The parallel efficiencies of the solvers are evaluated. It is shown that the PICCG-RP can solve the eddy current problem more efficiently than the BICCG. We also propose the special renumbering process in the PICCG-RP for dual-processor machines.
  • T. Iwashita, T. Matsuo, Y. Inui, M. Ishikawa, J. Umoto
    Electrical Engineering in Japan (English translation of Denki Gakkai Ronbunshi) 128 4 16 - 24 1999年 [査読有り][通常論文]
  • 岩下 武史, 松尾 哲司, 乾 義尚, 石川 本雄, 卯本 重郎
    電気学会論文誌. B, 電力・エネルギー部門誌 = The transactions of the Institute of Electrical Engineers of Japan. B, A publication of Power and Energy Society 118 6 643 - 650 電気学会 1998年06月 [査読無し][通常論文]
  • 岩下 武史, 松尾 哲司, 石川 本雄, 卯本 重郎
    電気学会論文誌. B, 電力・エネルギー部門誌 = The transactions of the Institute of Electrical Engineers of Japan. B, A publication of Power and Energy Society 117 6 864 - 871 電気学会 1997年05月20日 [査読無し][通常論文]
  • M Ishikawa, T Iwashita, J Tong
    Energy Conversion And Management 38 5 499 - 510 1997年03月 [査読無し][通常論文]
     
    A coal-fired MHD generator with 25 MW thermal input was designed and constructed at the Institute of Electrical Engineering (IEE), Chinese Academy of Sciences, in 1991. The present paper shows numerical analyses of the Chinese Faraday channel with a time-dependent 1-D gasdynamical model and 2-D electrodynamical model. The three key parameters of electrical behavior of the present MHD Faraday channel are evaluated with the analysis of the experimental data. The effective electrical conductivity is 5/9 of the theoretical value, the leakage resistance in the x-direction is 0.024 Ohm between cathodes and the leakage resistance in the gamma-direction is 82.4 Ohm, which can give close values of experimental results. (C) 1997 Elsevier Science Ltd. All rights reserved.
  • 岩下 武史, 松尾 哲司, 石川 本雄, 卯本 重郎
    電気学会論文誌. B, 電力・エネルギー部門誌 = The transactions of the Institute of Electrical Engineers of Japan. B, A publication of Power and Energy Society 116 8 973 - 978 電気学会 1996年07月20日 [査読無し][通常論文]
  • 電気学会論文誌B 116 8 973 - 978 1996年 [査読無し][通常論文]

MISC

  • Numerical Linear Algebra Based on Lattice H-Matrices
    伊田 明弘, Ichitaro Yamazaki, Rio Yokota, Satoshi Ohshima, Tasuku Hiraishi, Takeshi Iwashita, Tetsuya Hoshino, Toshihiro Hanawa HPC Asia 2020年01月 [査読無し][通常論文]
  • 髙橋 康人, 藤原 耕二, 徳増 正, 岩下 武史, 中島 浩 電気学会研究会資料. SA 2018 (53) 11 -16 2018年08月21日 [査読無し][通常論文]
  • 髙橋 康人, 藤原 耕二, 徳増 正, 岩下 武史, 中島 浩 電気学会研究会資料. RM 2018 (72) 11 -16 2018年08月21日 [査読無し][通常論文]
  • 浅沼 達也, 仙波 和樹, 山田 隆, 岩下 武史 計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science 23 2018年06月 [査読無し][通常論文]
  • 深谷猛, 岩下武史 情報処理学会研究報告(Web) 2018 (HPC-164) Vol.2018‐HPC‐164,No.6,1‐9 (WEB ONLY) 2018年04月30日 [査読無し][通常論文]
  • 髙橋 康人, 藤原 耕二, 岩下 武史, 中島 浩 電気学会研究会資料. RM 2018 (16) 5 -10 2018年01月24日 [査読無し][通常論文]
  • 髙橋 康人, 藤原 耕二, 岩下 武史, 中島 浩 電気学会研究会資料. SA 2018 (16) 5 -10 2018年01月24日 [査読無し][通常論文]
  • 髙橋 康人, 藤原 耕二, 徳増 正, 岩下 武史, 中島 浩 電気学会研究会資料. SA 2017 (67) 13 -18 2017年09月22日 [査読無し][通常論文]
  • 髙橋 康人, 藤原 耕二, 徳増 正, 岩下 武史, 中島 浩 電気学会研究会資料. RM 2017 (98) 13 -18 2017年09月22日 [査読無し][通常論文]
  • 仙波 和樹, 山田 隆, 岩下 武史, 美舩 健 電気学会研究会資料. SA 2017 (52) 5 -10 2017年09月21日 [査読無し][通常論文]
  • 仙波 和樹, 山田 隆, 岩下 武史, 美舩 健 電気学会研究会資料. RM 2017 (83) 5 -10 2017年09月21日 [査読無し][通常論文]
  • 深谷猛, 岩下武史 情報処理学会研究報告(Web) 2017 (HPC-160) Vol.2017‐HPC‐160,No.35,1‐11 (WEB ONLY) 2017年07月19日 [査読無し][通常論文]
  • 深谷 猛, 三浦 瑛絵, 岩下 武史 計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science 22 2017年05月 [査読無し][通常論文]
  • 髙橋 康人, 北尾 純士, 藤原 耕二, 岩下 武史, 中島 浩 電気学会論文誌. B 137 (3) 230 -237 2017年 [査読無し][通常論文]
     
    <p>This paper proposes the time domain parallel finite-element method (TDPFEM) coupling with equation of motion to efficiently obtain transient solutions of electric machines using parallel computing. The proposed TDPFEM is based on an iterative procedure combined with the Newton-Raphson iteration for a nonlinear magnetic field problem and equation of motion for a rotor. The scalability of the proposed method is examined in the starting transient analysis of a cage induction motor on large-scale parallel computing environment.</p>
  • 深谷 猛, 岩下 武史 計算力学講演会講演論文集 2017 (0) 2017年 [査読無し][通常論文]
     
    Iterative stencil computation is one of typical computation patterns appearing in engineering and other research fields. When naively implementing a program of iterative stencil computation, its performance is usually limited by the memory bandwidth of a computer system. Temporal and spatial tiling is known as a technique for improving the performance of iterative stencil computation by reducing its memory access cost. In this paper, an overview of the temporal and spatial tiling techniques is presented, and its application to 3-dimesional FDTD method is reported.
  • 河口 慈, 美舩 健, 松尾 哲司, 岩下 武史 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 (212) 87 -92 2016年09月07日 [査読無し][通常論文]
  • 髙橋 康人, 北尾 純士, 藤原 耕二, 岩下 武史, 中島 浩 電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 (212) 259 -264 2016年09月07日 [査読無し][通常論文]
  • 河口 慈, 美舩 健, 松尾 哲司, 岩下 武史 電気学会研究会資料. SA 2016 (57) 87 -92 2016年09月07日 [査読無し][通常論文]
  • 髙橋 康人, 北尾 純士, 藤原 耕二, 岩下 武史, 中島 浩 電気学会研究会資料. SA 2016 (57) 259 -264 2016年09月07日 [査読無し][通常論文]
  • 河口 慈, 美舩 健, 松尾 哲司, 岩下 武史 電気学会研究会資料. RM 2016 (103) 87 -92 2016年09月07日 [査読無し][通常論文]
  • 髙橋 康人, 北尾 純士, 藤原 耕二, 岩下 武史, 中島 浩 電気学会研究会資料. RM 2016 (103) 259 -264 2016年09月07日 [査読無し][通常論文]
  • ポストムーア時代におけるFLOPSからBYTESへの変革
    松岡聡, 天野英晴, 中島研吾, 井上 弘士, 工藤 知宏, 丸山直也, 田浦健次朗, 岩下武史, 片桐孝洋, 塙敏博, 遠藤敏夫 情報処理学会研究報告HPC-155-2016 1-10 2016年08月10日 [査読無し][通常論文]
  • 伊田 明弘, 平石 拓, 岩下 武史 計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science 21 2016年05月 [査読無し][通常論文]
  • 河口 慈, 美舩 健, 松尾 哲司, 岩下 武史 電気学会研究会資料. SA 2016 (18) 7 -10 2016年01月21日 [査読無し][通常論文]
  • 河口 慈, 美舩 健, 松尾 哲司, 岩下 武史 電気学会研究会資料. RM 2016 (18) 7 -10 2016年01月21日 [査読無し][通常論文]
  • 岩下 武史, 伊田 明弘, 美舩 健, 髙橋 康人 計算工学 21 (4) 3514 -3517 2016年 [査読無し][通常論文]
  • 深谷猛, 岩下武史 日本応用数理学会年会講演予稿集(CD-ROM) 2016 ROMBUNNO.9GATSU12NICHI,11:00,3E,4 2016年 [査読無し][通常論文]
  • 河合直聡, 伊田明弘, 岩下武史, 中島浩 日本応用数理学会年会講演予稿集(CD-ROM) 2016 ROMBUNNO.9GATSU12NICHI,11:00,3E,3 2016年 [査読無し][通常論文]
  • 仙波 和樹, たに 浩司, 山田 隆, 岩下 武史, 髙橋 康人, 中島 浩 電気学会研究会資料. SA 2015 (76) 39 -44 2015年09月28日 [査読無し][通常論文]
  • 仙波 和樹, たに 浩司, 山田 隆, 岩下 武史, 髙橋 康人, 中島 浩 電気学会研究会資料. RM 2015 (114) 39 -44 2015年09月28日 [査読無し][通常論文]
  • 岩下 武史 情報処理 56 (5) 438 -441 2015年04月15日 [査読無し][通常論文]
     
    多くの数値シミュレーションでは,倍精度浮動小数点数による計算を行うが,これらの計算中には誤差が含まれる.これらの計算誤差の影響はしばしばシミュレーションの精度に致命的な影響を与える.たとえば,連立一次方程式の求解法には直接法と反復法の二種類が存在するが,いずれの手法を用いたとしても,係数行列の条件数が非常に大きい場合,高精度の(数値)解を得ることは困難となる.また,反復法を実応用分野で用いる場合,解の収束率を向上させる目的で前処理が使用されることが多い.前処理の主たる目的は計算時間の短縮であるが,少ない反復回数で収束解を得ることにより,計算誤差の影響を軽微に抑制する副次的な効果を持っている.
  • 棟形克己, 平石拓, 伊田明弘, 岩下武史, 中島浩 情報処理学会全国大会講演論文集 77th (1) 1.51-1.52 2015年03月17日 [査読無し][通常論文]
  • 髙橋 康人, 藤原 耕二, 岩下 武史, 中島 浩 電気学会研究会資料. SA 2015 (33) 93 -98 2015年03月06日 [査読無し][通常論文]
  • 髙橋 康人, 藤原 耕二, 岩下 武史, 中島 浩 電気学会研究会資料. RM 2015 (25) 93 -98 2015年03月06日 [査読無し][通常論文]
  • 棟形 克己, 平石 拓, 伊田 明弘, 岩下 武史, 中島 浩 研究報告ハイパフォーマンスコンピューティング(HPC) 2015 (5) 1 -15 2015年02月23日 [査読無し][通常論文]
     
    階層型行列 (H 行列) は,N 個の要素間の N×N 個の相互関係を表す密行列の圧縮表現の一つである.本研究では,H 行列の生成および H 行列ベクトル積の MPI/OpenMP ハイブリッド並列化を,動的負荷分散を用いて行った.H 行列の生成は,小行列 (葉行列) への行列の区分けと,各葉行列の要素計算により行われる.後者は葉行列単位のタスク並列化が可能だが,各コアにタスク集合を静的に割り当てる実装では,各タスクの計算負荷を正確には見積もれないこと,および全体に対する負荷割合が大きなタスクの存在により十分な負荷均衡が得られない.そこで,MPI および OpenMP の 2 レベルの階層型マスタワーカ方式による動的タスク割り当てを行い,さらに OpenMP レベルでは大きなタスクにプロセス内の全スレッドを割り当てることで負荷を均衡化した.H 行列ベクトル積でも同様のタスク並列化が可能だが,タスクのプロセス間移動のコストが大きいため,MPI レベルでは葉行列生成を担当したプロセスに引き続きその葉行列に関する部分計算を静的に割り当て,OpenMP レベルでのみ生成処理と同様の動的タスク割り当てを行った.生成処理の負荷均衡化の結果,この方式でプロセス間においても良好な負荷均衡が得られる.表面電荷法による係数行列生成およびその行列に対する行列ベクトル積を例題として性能評価を行った結果,32 プロセス×8 スレッドによる並列実行では,従来の負荷見積もりに基づく静的割当手法に対して,H行列生成では 3.4 倍,H 行列ベクトル積では 2.5 倍の性能が得られた.Hierarchical matrix (H-matrix) is an approximated form to represent N × N correlations of N objects, which usually requires a N × N huge dense matrix. This paper proposes hybrid MPI/OpenMP implementations of H-matrix generation and H-matrix-vector multiplication using dynamic load balancing. H-matrix generation is done by partitioning a matrix into submatrices called leaf matrices, followed by calculating element values of the leaf matrices. We can apply task parallelism to the latter operation by treating each leaf matrix as a parallelization unit. However, we cannot achieve a good speedup when assigning a set of tasks to each processor core statically, because (1) we cannot predict the computational amount of each task precisely and (2) there exist tasks whose ratios of the computational amounts to the total amount are too large. We solved these problems by (1) dynamic task assignment based on the hierarchical master-worker method with the MPI and OpenMP levels, and (2) dividing a large task and executing it in parallel using all threads in an MPI process. We can apply the same parallelization strategy to H-matrix-vector multiplication. However, because the task migration cost among processes is too high, we reused the same task assignment as in H-matrix generation on the MPI level, and performed dynamic task assignment only on the OpenMP level. We can get better load balance even among processes due to the dynamic load balancing used in H-matrix generation. We evaluated the performances of our implementations when generating a coefficient matrix used in the surface charge method as an H-matrix and multiplying the H-matrix by a vector. As a result, in an execution with 32 processes × 8 threads, we achieved a 3.4 times and 2.5 times better performance in H-matrix generation and H-matrix-vector multiplication respectively, than the existing implementations that perform static task assignment based on estimated computational amounts of tasks.
  • 過去の求解プロセス情報を活用した誤差修正用写像行列の構築
    岩下武史, 河口 慈, 美舩 健, 松尾哲司 応用数理学会 2015年度年会 2015年 [査読無し][通常論文]
  • 髙橋 康人, 徳増 正, 藤原 耕二, 岩下 武史, 中島 浩 電気学会研究会資料. SA 2014 (80) 13 -18 2014年09月26日 [査読無し][通常論文]
  • 髙橋 康人, 徳増 正, 藤原 耕二, 岩下 武史, 中島 浩 電気学会研究会資料. RM 2014 (96) 13 -18 2014年09月26日 [査読無し][通常論文]
  • 戸水 真哉, 美舩 健, 松尾 哲司, 岩下 武史 電気学会研究会資料. SA 2014 (64) 29 -32 2014年09月25日 [査読無し][通常論文]
  • 戸水 真哉, 美舩 健, 松尾 哲司, 岩下 武史 電気学会研究会資料. RM 2014 (80) 29 -32 2014年09月25日 [査読無し][通常論文]
  • 伊田明弘, 岩下武史, 美舩健, 高橋康人 計算工学講演会論文集(CD-ROM) 19 ROMBUNNO.F-6-2 2014年06月11日 [査読無し][通常論文]
  • Parallel H-Matrices with Adaptive Cross Approximation for Large-Scale Simulation
    Akihiro Ida, Takeshi Iwashita 16th SIAM Conference on Parallel Processing for Scientific Computing 2014年02月20日 [査読無し][通常論文]
  • 超大規模境界要素解析に向けた階層型行列法の改良と並列化手法
    伊田 明弘, 岩下 武史 17回環瀬戸内応用数理学会 2014年01月12日 [査読無し][通常論文]
  • 高橋 康人, 徳増 正, 藤原 耕二, 岩下 武史, 中島 浩 計算力学講演会講演論文集 2014 (0) 114 -116 2014年 [査読無し][通常論文]
     
    時間分割型並列有限要素法の実機解析における有効性検証を目的として,並列化時間周期有限要素法と並列化TP-EEC法の特徴を整理し,PWMインバータ駆動IPMモータを対象としてその得失比較を行う.
  • Y. Takahashi, A. Ahagon, K. Fujiwara, T. Iwashita, H. Nakashima IET Conference Publications 2014 (627) 2014年 [査読無し][通常論文]
     
    This paper presents large-scale induced electric field analysis of human body due to extremely low frequency magnetic field by using a parallel fast multipole method accelerated boundary element method. The numerical results are compared with the finite element method from the standpoints of accuracy and computational cost.
  • 野瀬田裕樹, 河合直聡, 伊田明弘, 岩下武史, 中島浩, 美舩健, 高橋康人, 荻野 正雄, 岩下 武史, 東田 学 研究報告ハイパフォーマンスコンピューティング(HPC) 2013 (16) 1 -7 2013年12月09日 [査読無し][通常論文]
     
    現在いわゆるスーパーコンピュータと呼ばれる大規模計算機システムは x86 系,SPARC 系,POWER 系,ベクトル系,GPU 系などさまざまなアーキテクチャから構成されている.さらに近年では ARM 系や MICなどから構成される新しいスーパーコンピュータシステムも出てきている.これらのコンピュータシステムでは計算コアのアーキテクチャが異なるため,アプリケーションによってはそのシステムに対して向き不向きがあり,また性能チューニングも各アーキテクチャにより基本的には異なる.そのため,今までと異なるコンピュータシステムにアプリケーションの移植を行うことは非常に手間のかかる作業となっている.そこで本研究では,JHPCN-HPCI システムで利用可能である x86 系,SPARC 系,POWER 系,ベクトル系といった異なるアーキテクチャのコンピュータシステムを利用し,システムの実性能評価を行い,アーキテクチャ毎に性能がどのようになるか調べた.アプリケーションとしては実際に研究に用いられている電磁流体コードを用いて,いくつかの最適化を施したケースを評価した.その結果,x86 系ではベクトル系に効くベクトル化が効果的であり,SPARC 系と POWER 系ではキャッシュの効率的な利用が効果的となった.また,効果的な結果とそうで無いものを比べると倍程度の性能差があった.電磁流体コードは中性流体に電磁力を含めたコードであるため,本研究の結果は流体コードにも効果的であると考えられる.Recent supercomputer systems consist of various architecture such as X86, SPARC, POWER, Vector and GPU. In addition the computer systems which consist of MIC and ARM are appeared. Some applications are better suited for these computer systems or not due to the different architectures of calculation core they have. The way of performance optimization is also difference depending on the architecture. Thus it is hard to introduce applications running on a computer system to another computer system. In this study we evaluate the effective performance of various architectures computer systems using an MHD (magnetohydrodynamic) simulation code. The MHD simulation code used in this study solves the planetary magnetosphere in the space plasma. We evaluate two types of optimization, which are the vector suited and effective cache-hit. As the results, we found the vector suited optimization is effective to the X86 architecture computer systems and the cache hit optimization is suited for the SPARC and POWER architectures. There is the twice difference of performance between the results of effective optimization and not. The MHD simulation code is a kind of fluid code (including the magneto-electric force) so that it is general that these results are performed in the fluid codes.
  • 深沢 圭一郎, 片桐 孝洋, 大宮 学, 江川 隆輔, 大島 聡史, 青木 尊之, 下川辺 隆史, 荻野 正雄, 岩下 武史, 東田 学 研究報告計算機アーキテクチャ(ARC) 2013 (16) 1 -7 2013年12月09日 [査読無し][通常論文]
     
    現在いわゆるスーパーコンピュータと呼ばれる大規模計算機システムは x86 系,SPARC 系,POWER 系,ベクトル系,GPU 系などさまざまなアーキテクチャから構成されている.さらに近年では ARM 系や MICなどから構成される新しいスーパーコンピュータシステムも出てきている.これらのコンピュータシステムでは計算コアのアーキテクチャが異なるため,アプリケーションによってはそのシステムに対して向き不向きがあり,また性能チューニングも各アーキテクチャにより基本的には異なる.そのため,今までと異なるコンピュータシステムにアプリケーションの移植を行うことは非常に手間のかかる作業となっている.そこで本研究では,JHPCN-HPCI システムで利用可能である x86 系,SPARC 系,POWER 系,ベクトル系といった異なるアーキテクチャのコンピュータシステムを利用し,システムの実性能評価を行い,アーキテクチャ毎に性能がどのようになるか調べた.アプリケーションとしては実際に研究に用いられている電磁流体コードを用いて,いくつかの最適化を施したケースを評価した.その結果,x86 系ではベクトル系に効くベクトル化が効果的であり,SPARC 系と POWER 系ではキャッシュの効率的な利用が効果的となった.また,効果的な結果とそうで無いものを比べると倍程度の性能差があった.電磁流体コードは中性流体に電磁力を含めたコードであるため,本研究の結果は流体コードにも効果的であると考えられる.Recent supercomputer systems consist of various architecture such as X86, SPARC, POWER, Vector and GPU. In addition the computer systems which consist of MIC and ARM are appeared. Some applications are better suited for these computer systems or not due to the different architectures of calculation core they have. The way of performance optimization is also difference depending on the architecture. Thus it is hard to introduce applications running on a computer system to another computer system. In this study we evaluate the effective performance of various architectures computer systems using an MHD (magnetohydrodynamic) simulation code. The MHD simulation code used in this study solves the planetary magnetosphere in the space plasma. We evaluate two types of optimization, which are the vector suited and effective cache-hit. As the results, we found the vector suited optimization is effective to the X86 architecture computer systems and the cache hit optimization is suited for the SPARC and POWER architectures. There is the twice difference of performance between the results of effective optimization and not. The MHD simulation code is a kind of fluid code (including the magneto-electric force) so that it is general that these results are performed in the fluid codes.
  • 仙波 和樹, たに 浩司, 山田 隆, 岩下 武史, 髙橋 康人, 中島 浩 電気学会研究会資料. RM 2013 (89) 85 -88 2013年09月27日 [査読無し][通常論文]
  • 清水 康平, 美船 健, 岩下 武史, 松尾 哲司 電気学会研究会資料. SA, 静止器研究会 2013 (59) 19 -22 2013年09月26日 [査読無し][通常論文]
  • 仙波 和樹, たに 浩司, 山田 隆, 岩下 武史, 高橋 康人, 中島 浩 電気学会研究会資料. SA, 静止器研究会 2013 (75) 85 -88 2013年09月26日 [査読無し][通常論文]
  • IC前処理におけるSIMD演算活用のためのブロック化手法
    武村直和, 岩下武史, 伊田明弘, 中島浩 日本応用数理学会2013年度年会 2013年09月 [査読無し][通常論文]
  • 伊田 明弘, 岩下 武史, 美舩 健 計算工学講演会論文集 Proceedings of the Conference on Computational Engineering and Science 18 2013年06月 [査読無し][通常論文]
  • 河合直聡, 岩下武史, 中島浩 先進的計算基盤システムシンポジウム論文集 2013 103 -104 2013年05月15日 [査読無し][通常論文]
  • 野瀬田裕樹, 野瀬田裕樹, 河合直聡, 伊田明弘, 岩下武史, 中島浩, 美舩健, 高橋康人 情報処理学会研究報告(CD-ROM) 2012 (6) ROMBUNNO.HPC-138,NO.16 2013年04月15日 [査読無し][通常論文]
  • 野瀬田裕樹, 河合直聡, 伊田明弘, 岩下武史, 中島浩, 美舩健, 高橋康人 情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2013 (16) 1 -7 2013年02月14日 [査読無し][通常論文]
  • Performance Evaluation of Multithreaded Iterative Solver on Recent Processors
    Takeshi Iwashita, Akihiro Ida, Masatoshi Kawai, Hiroshi Nakashima SIAM Conf. Computational Science and Engineering 2013年02月 [査読無し][通常論文]
  • 美舩 健, 上畠 哲志, 岩下 武史, 松尾 哲司 電気学会研究会資料. RM, 回転機研究会 2012 (94) 49 -52 2012年09月10日 [査読無し][通常論文]
  • 岡本 吉史, 高橋 康人, 藤原 耕二, 阿波根 明, 美舩 健, 岩下 武史 電気学会研究会資料. RM, 回転機研究会 2012 (94) 53 -58 2012年09月10日 [査読無し][通常論文]
  • 野瀬田裕樹, 河合直聡, 岩下武史, 高橋康人, 美舩健, 中島浩 先進的計算基盤システムシンポジウム論文集 2012 69 -70 2012年05月09日 [査読無し][通常論文]
  • 合田 憲人, 東田 学, 坂根 栄作, 天野 浩文, 小林 克志, 棟朝 雅晴, 江川 隆輔, 建部 修見, 鴨志田 良和, 滝澤 真一朗, 永井 亨, 岩下 武史, 石川 裕 先進的計算基盤システムシンポジウム論文集 2012 227 -236 2012年05月09日 [査読無し][通常論文]
  • Basic Design and Implementation Method of Framework Software for Boundary Element Analyses
    Takeshi Iwashita, Akihiro Ida 1st Joint CREST Workshop Toudai and RIKEN 2012年05月 [査読無し][通常論文]
  • 高橋 康人, 徳増 正, 藤田 真史, 岩下 武史, 若尾 真治, 藤原 耕二, 石原 好之 電気学会研究会資料. RM, 回転機研究会 2012 (1) 31 -36 2012年01月26日 [査読無し][通常論文]
  • 河合 直聡, 岩下 武史, 中島 浩 ハイパフォーマンスコンピューティングと計算科学シンポジウム論文集 2012 107 -116 2012年01月17日 [査読無し][通常論文]
  • マルチフィジックスおよび最適化に向けたハイパフォーマンス計算力学
    樫山 和夫, 牛島 省, 寺田 賢二郎, 岡澤 重信, 木村 一郎, 中畑 和之, 浅井 光輝, 松本 純一, 岩下 武史, 小山田 耕二 学際大規模情報基盤共同利用・共同研究拠点 平成23年度研究 最終報告書, 11-NA04 2012年 [査読無し][通常論文]
  • 美舩 健, 難波 亮介, 岩下 武史, 松尾 哲司 電気学会研究会資料. SA, 静止器研究会 2011 (46) 35 -38 2011年08月25日 [査読無し][通常論文]
  • 北尾 純士, 高橋 康人, 藤原 耕二, 石原 好之, 美舩 健, 岩下 武史 電気学会研究会資料. SA, 静止器研究会 2011 (46) 39 -44 2011年08月25日 [査読無し][通常論文]
  • 美舩 健, 難波 亮介, 岩下 武史, 松尾 哲司 電気学会研究会資料. RM, 回転機研究会 2011 (59) 35 -38 2011年08月25日 [査読無し][通常論文]
  • 北尾 純士, 高橋 康人, 藤原 耕二, 石原 好之, 美舩 健, 岩下 武史 電気学会研究会資料. RM, 回転機研究会 2011 (59) 39 -44 2011年08月25日 [査読無し][通常論文]
  • 中島 研吾, 佐藤 正樹, 古村 孝志, 奥田 洋司, 岩下 武史, 阪口 秀 研究報告ハイパフォーマンスコンピューティング(HPC) 2011 (44) 1 -9 2011年07月20日 [査読無し][通常論文]
     
    ヘテロジニアスなアーキテクチャによる計算ノードを有するポストペタスケールシステムの処理能力を充分に引き出す科学技術アプリケーションの効率的な開発,安定な実行に資する 「自動チューニング機構を有するアプリケーション開発・実行環境:ppOpen-HPC」 を開発する.対象離散化手法を有限要素法,差分法,有限体積法,境界要素法,個別要素法に限定し,各手法の特性に基づきハードウェアに依存しない共通インタフェースを有するアプリケーション開発用ライブラリ群,耐故障機能を含む実行環境を提供する.自動チューニング技術の導入により,様々な環境下における最適化ライブラリ,耐故障機能を持つ最適化アプリケーションの自動生成を目指す.本研究は 2014 年度に東京大学情報基盤センターに導入予定の数十ペタフロップス級システムをターゲットとし,同システム上で実アプリケーションによって検証,改良し,一般に公開する.We propose an open source infrastructure for development and execution of optimized and reliable simulation codes on post-peta (pp) scale parallel computers with heterogeneous computing nodes which consist of multicore CPU's and accelerators., named "ppOpen-HPC". ppOpen-HPC consists of various types of libraries, which covers various types of procedures for scientific computations. Source code developed on a PC with a single processor is linked with these libraries, and generated parallel code is optimized for post-peta scale system. Capability of automatic tuning is important and critical technology for further development on new architectures and maintenance of the framework.
  • 安部 達也, 平石 拓, 三宅 洋平, 岩下 武史, 中島 浩 研究報告ハイパフォーマンスコンピューティング(HPC) 2011 (59) 1 -8 2011年07月20日 [査読無し][通常論文]
     
    分散制約充足問題を分散並列計算環境で解くにあたり,ジョブを処理の単位とする分散並列処理 (ジョブ並列) に特化したジョブ並列スクリプト言語 Xcrypt で処理を記述することにより,実際の分散並列計算環境であるところの,いわゆるスーパーコンピュータを利用する方法を紹介する.さらに,Xcrypt の遠隔ジョブ投入機構を利用することにより,制約が遠隔の計算機に分散された状態からの制約充足問題,つまり,真の意味での分散制約充足問題を簡便に取り扱うことができることを示す.We introduce a method of parallel executions based on the job unit (job-level parallel executions) for solving distributed constraint satisfaction problems (DCSPs) in parallel and distributed computation environments, the so-called today's many supercomputers. Throughout introducing the method we use the job-level parallel script language Xcrypt, specific to job-level parallel executions. We also show that Xcrypt provides us with a feature of submitting remotely jobs for solving realistic DCSPs (under the circumstances that constraints are truely distributed in separate computers).
  • 南 武志, 岩下 武史, 中島 浩 研究報告ハイパフォーマンスコンピューティング(HPC) 2011 (65) 1 -8 2011年07月20日 [査読無し][通常論文]
     
    本論文では高周波電磁場解析の一手法である 3 次元 FDTD 法におけるキャッシュメモリを考慮した性能改善手法の提案と性能評価を行う.3 次元 FDTD 法の計算カーネルは時間発展に関するループにより与えられ,各タイムステップにおいて電場と磁場の値が交互に更新される.3 次元 FDTD 法の計算カーネルは演算あたりのロード/ストア量が大きく,一般にメモリ帯域の影響を受けやすい計算である.キャッシュメモリのヒット率を向上しメインメモリへのアクセスによる性能の低下を軽減する性能改善手法として,解析領域をタイルと呼ぶ小領域に分割し各タイル内で複数のタイムステップに関する処理を連続して行うタイリングと呼ばれる手法が存在する.しかし,単純な固定タイルによる実装では,タイル間での冗長な計算がオーバーヘッドとなっていた.そこで,本論文ではタイリング手法において,タイルの位置と形状を時間ステップごとに変化させ計算量の増加を防ぐ手法を提案する.提案手法を評価した結果,AMD 製クアッドコア Opteron プロセッサよる数値実験において 4 スレッドによる並列処理を行った場合,一般的な 3 次元 FDTD 法の実装と比較して計算時間を約 50% 短縮させることに成功した.This paper deals with performance improvement of three dimensional FDTD kernel for high frequency electromagnetic field analyses. The FDTD method is one of explicit time stepping methods. The electric and magnetic fields are updated alternately in each time step. Since the calculation of the FDTD method has a large byte/flop ratio, its performance is limited by memory throughput. For a remedy of it, there is a technique called tiling, in which the analyzed domain is divided into multiple small domains. By updating electrical and magnetic fields in each small domain in multiple time steps, we can utilize cache data efficiently. However, when we implement tiling based on simple fixed size tiles, redundant calculations are required between adjacent tiles. In this paper, we propose a new tiling technique for three dimensional FDTD method without redundant calculations. This method prevents an increase in the amount of calculations by changing the position and shape of the tile at each time step. Numerical tests on a quad-core AMD Opteron processor show that the proposed three dimensional FDTD method attains up to 50 percent reduction in the calculation time compared with an ordinary implementation of the three dimensional FDTD method.
  • 河合直聡, 岩下武史, 中島浩, 三宅洋平 先進的計算基盤システムシンポジウム論文集 2011 226 -226 2011年05月18日 [査読無し][通常論文]
  • A Use of Classical Algebraic Multigrid Method in Finite Edge-Element Analysis
    Ryosuke Namba, Takeshi Mifune, Takeshi Iwashita, Tetsuji Matsuo Proc. 20thMAGDA Conf. in Pacifi c Asia (MAGDA2011), pp. 260–264, 2011-11. 2011年 [査読有り][通常論文]
  • A Block Diagonal Preconditioning Technique for Finite Edge-Element Formulation Using a Voxel Mesh,
    Takeshi Mifune, Ryosuke Namba, Takeshi Iwashita, Tetsuji Matsuo Proc. 15th Biennial IEEE Conf. Electromagnetic Fields Computation (CEFC2012), p.325, 2012-11. 2011年 [査読有り][通常論文]
  • An Implicit Error Correction Method for the T- Ω Formulation Including Fake Conductors
    Takeshi Mifune, S. Kamihata, Takeshi Iwashita, Tetsuji Matsuo Proc. 15th Biennial IEEE Conf. Electromagnetic Fields Computation (CEFC2012), p.241, 2012-11. 2011年 [査読有り][通常論文]
  • 辺要素有限要素法を用いた磁界解析における自動加速機能付ICCG 法の有効性に関する検討
    北尾純士, 高橋康人, 藤原耕二, 石原好之, 美舩健, 岩下武史 平成23 年電気学会全国大会,5-196, 2011-3. 2011年 [査読有り][通常論文]
  • 係数行列の対角ブロックを使用する前処理による直方体辺要素静磁界解析の高速化
    難波亮介, 美舩健, 岩下武史 平成23 年電気学会全国大会,5-192, 2011-3. 2011年 [査読有り][通常論文]
  • 辺要素有限要素法を用いた磁界解析に対する 自動加速機能付ICCG 法の有効性検証
    北尾純士, 高橋康人, 藤原耕二, 美舩健, 岩下武史, 石原好之 第14 回環瀬戸内応用数理研究部会シンポジウム講演予稿集,pp.213– 218, 2011-1. 2011年 [査読有り][通常論文]
  • 南 武志, 岩下 武史, 高橋 康人, 中島 浩 研究報告ハイパフォーマンスコンピューティング(HPC) 2010 (5) 1 -7 2010年02月15日 [査読無し][通常論文]
     
    本論文では,高周波電磁場解析の一手法である FDTD 法におけるキャッシュメモリを考慮した性能改善手法に関して述べる.FDTD 法の計算カーネルは時間発展に関するループにより与えられ,各タイムステップにおいて電場と磁場の値が交互に更新される.FDTD カーネルは演算あたりのロード/ストア量が大きく,一般にメモリ帯域の影響を受けやすい計算である.そこで,本論文では解析領域を小領域に分割し,これらの小領域での電磁場計算を複数タイムステップ分まとめて計算することにより,キャッシュメモリを有効活用し,FDTD カーネルを高速に実行する方法を提案する.その結果,4 コアの AMD Opteron プロセッサによる数値実験において,各コアで FDTD カーネルを並行に実行した場合,通常の FDTD 法の実装と比較して,約 3 割の速度向上を得た.This paper deals with performance improvement of FDTD kernel for high frequency electromagnetic field analyses. The FDTD method is one of explicit time stepping methods. The electric and magnetic fields are updated alternately in each time step. Since the calculation of the FDTD method has a large byte/flop ratio, its performance is strongly affected by memory throughput. In this paper, we propose a cache-aware FDTD method, in which the analyzed domain is divided into multiple small domains. By updating electrical and magnetic fields in each small domain in multiple time steps, we can utilize cache data efficiently. Numerical tests on a quad-core AMD Opteron processor show that the proposed FDTD method attains up to 30 percent speedup compared with an ordinary implementation of the FDTD method.
  • 松尾 哲司, 山崎 由也, 岩下 武史 電気学会研究会資料. MAG, マグネティックス研究会 2010 (1) 87 -92 2010年01月28日 [査読無し][通常論文]
  • 美舩 健, 高橋 康人, 岩下 武史 電気学会研究会資料. SA, 静止器研究会 2010 (1) 57 -62 2010年01月28日 [査読無し][通常論文]
  • 高橋 康人, 美舩 健, 岩下 武史 電気学会研究会資料. SA, 静止器研究会 2010 (1) 63 -68 2010年01月28日 [査読無し][通常論文]
  • 廣谷 迪, 美舩 健, 岩下 武史 電気学会研究会資料. SA, 静止器研究会 2010 (1) 77 -82 2010年01月28日 [査読無し][通常論文]
  • 美舩 健, 高橋 康人, 岩下 武史 電気学会研究会資料. RM, 回転機研究会 2010 (1) 57 -62 2010年01月28日 [査読無し][通常論文]
  • 高橋 康人, 美舩 健, 岩下 武史 電気学会研究会資料. RM, 回転機研究会 2010 (1) 63 -68 2010年01月28日 [査読無し][通常論文]
  • 廣谷 迪, 美舩 健, 岩下 武史 電気学会研究会資料. RM, 回転機研究会 2010 (1) 77 -82 2010年01月28日 [査読無し][通常論文]
  • 松尾 哲司, 山崎 由也, 岩下 武史 電気学会研究会資料. RM, 回転機研究会 2010 (1) 87 -92 2010年01月28日 [査読無し][通常論文]
  • 美舩 健, 高橋 康人, 岩下 武史 電気学会研究会資料. MAG, マグネティックス研究会 2010 (1) 57 -62 2010年01月28日 [査読無し][通常論文]
  • 高橋 康人, 美舩 健, 岩下 武史 電気学会研究会資料. MAG, マグネティックス研究会 2010 (1) 63 -68 2010年01月28日 [査読無し][通常論文]
  • 廣谷 迪, 美舩 健, 岩下 武史 電気学会研究会資料. MAG, マグネティックス研究会 2010 (1) 77 -82 2010年01月28日 [査読無し][通常論文]
  • 松尾 哲司, 山崎 由也, 岩下 武史 電気学会研究会資料. SA, 静止器研究会 2010 (1) 87 -92 2010年 [査読無し][通常論文]
     
    Demagnetizing field in micromagnetic simulation is studied under periodic boundary condition. The demagnetizing field matrix is superposed to obtain magnetostatic field induced by periodic magnetization. To evaluate the influence of periodic structure, macroscopic demagnetization factors are defined. A large demagnetizing field yields a linear magnetization where the susceptibility is given by the inverse of the macroscopic demagnetizing factor. © 2010 IEEE.
  • Yasuhito Takahashi, Hiroyuki Kaimori, Akihisa Kameari, Tadashi Tokumasu, Masafumi Fujita, Shinji Wakao, Takeshi Iwashita, Koji Fujiwara, Yoshiyuki Ishihara Digests of the 2010 14th Biennial IEEE Conference on Electromagnetic Field Computation, CEFC 2010 2010年 [査読無し][通常論文]
     
    This paper investigates the acceleration of convergence to a steady state in a transient analysis of rotating machines using the time-periodic explicit error correction (TP-EEC) method. The efficient method to deal with the movement of the rotor and different time-periodicity in the fixed and moving parts of the mesh is developed. Numerical results verify the effectiveness of the developed method. © 2010 IEEE.
  • Perfmance Evaluation of Additive Schwarz Type Folded IC \nPreconditioner in Electromagnetic Field Computation Using Edge-Based FEM
    Yasuhito Takahashi, Takeshi Mifune, Takeshi Iwashita Kyoto-Forum on Krylov Subspace method, pp. 16 21,2010-3. 2010年 [査読有り][通常論文]
  • 静磁場解析における折畳み前処理の並列化に関する検討
    佐藤翔士, 美舩健, 高橋康人, 岩下武史 平成22年電気関係学会関西支部連合大会,4A203-15, p. 497, 2010-11. 2010年 [査読有り][通常論文]
  • 静磁界辺要素解析における折畳み前処理のOpenMP による並列化
    佐藤翔士, 美舩健, 高橋康人, 岩下武史 第19 回MAGDA コンファレンス,OS4-TA3,pp.135–138, 2010-11. 2010年 [査読有り][通常論文]
  • AC-AT block IC 前処理による辺要素静磁界解析の高速化に関する検討
    難波亮介, 美舩健, 高橋康人, 岩下武史 平成22年電気学会全国大会, no. 5, p. 185, 2010-3. 2010年 [査読有り][通常論文]
  • 折畳み前処理を用いた静磁場解析におけるRCM 法に関する基礎的検討
    佐藤翔土, 美舩健, 高橋康人, 岩下武史 平成22 年電気学会全国大会, no. 5, p. 184, 2010-3. 2010年 [査読有り][通常論文]
  • 地震発生サイクルシミュレーション コードの高速化:(2) Hierarchical Matrices 法の適用
    平原和朗, 大谷真紀子, 高橋康人, 堀高峰, 兵藤守, 中島浩, 岩下武史 日本地震学会秋季大会,2010-10. 2010年 [査読有り][通常論文]
  • 福原 敏行, 高橋 康人, 岩下 武史, 中島 浩 情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2009 (2) 1 -8 2009年10月02日 [査読無し][通常論文]
     
    本論文では,分散メモリ形式に対応した並列化 ICCG ソルバを開発した.局所 IC 分解前処理と多色順序付け法を併用し,OpenMP と MPI の両者を用いるハイブリッド並列化を可能とした.3 種の数値実験例において,Flat MPI による並列化を行った場合とハイブリッド並列処理を用いた場合の比較検討を実施した.数値実験の結果,いずれの数値例においてもハイブリッド並列方式が Flat MPI より良好な結果を示し,最大で 2 倍以上の性能差があったことを報告する.
  • 高橋 康人, 岩下 武史, 徳増 正, 藤田 真史, 若尾 真治 電気学会研究会資料. SA, 静止器研究会 2009 (69) 17 -22 2009年09月17日 [査読無し][通常論文]
  • 岩下 武史, 高橋 康人, 中島 浩 情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2009 (11) 1 -8 2009年07月28日 [査読無し][通常論文]
     
    本論文では,ランダムスパース係数行列を対象とした並列化 ICCG ソルバについて述べる.差分解析において提案されたブロック化多色順序付け法をランダムスパース係数行列用に拡張した代数ブロック化多色順序付け法を提案する.代入計算におけるキャッシュヒット率の向上と ICCG 法の収束性改善を目的とするブロック化と色付けの方法を提示する.提案手法により得られたソルバを 3 種の数値例で検証した.その結果,Fujitsu HX600 1ノード (16コア) 使用時において従来法である代数多色順序付け法と比較して,計算時間を約半分に短縮することに成功した.
  • 黒田 久泰, 直野 健, 岩下 武史 情報処理 50 (6) 505 -511 2009年06月15日 [査読無し][通常論文]
     
    ライブラリは,汎用性の高い複数のプログラムを再利用できる形でひとまとまりにしたものである.身近な例として,C言語でよく使われるprintfやmalloc関数などはC言語標準ライブラリ関数と言われているものである.ライブラリといってもファイル入出力,メモリ管理,通信に関するものなど数多く存在するが,ここでは特に数値計算ライブラリを取り上げる.そして,自動チューニング技術がどのように数値計算ライブラリで適用されているのかについて紹介する.本記事では,まず自動チューニング機能を取り入れていない従来型の数値計算ライブラリについて紹介し,その後,自動チューニング機能付き数値計算ライブラリについて紹介する.
  • 岩下 武史, 美舩 健, 島崎 眞昭 数理解析研究所講究録 1638 18 -27 2009年04月 [査読無し][通常論文]
  • 岩下 武史, 美舩 健, 島崎 眞昭 数理解析研究所講究録 1638 18 -27 2009年04月 [査読無し][通常論文]
  • 平石 拓, 岩下 武史, 中島 浩 研究報告計算機アーキテクチャ(ARC) 2009 (14) 175 -180 2009年02月19日 [査読無し][通常論文]
     
    車体の設計や創薬等の計算科学における大規模シミュレーションを行う際,パラメータスイープや最適パラメータ探索のために,同一のジョブをパラメータを変えつつ,大量に繰り返し,あるいは並列に実行することが多い.このような処理を自動化する際,既存のワークフローツールを用いると簡便ではあるが汎用性に欠け, Perl 等の既存のスクリプト言語で記述するのは計算科学の研究者には一般に敷居が高い.そこで我々は,既存のスクリプト言語をベースとしつつ,上記の自動化を簡便に記述するための機能を追加したジョブ並列スクリプト言語を開発している.複雑な探索アルゴリズムや同時投入ジョブ数の制限等の機能はオブジェクト指向の抽象クラスとしてモジュール化する.ユーザは提供済みのモジュールをそのまま使うことも,必要に応じて改造したり新たに開発することもできるため,汎用性と簡便性が両立できる.本発表では,バックエンドとなるジョブスケジューラを含むシステムの全体像と言語のプロトタイプを示す.Computational scientists often perform large scale simulations in their research or development such as car body design and drug discovery. In such simulations, they often execute plenty of sequential and/or parallel jobs with different parameters for parameter sweep or optimal parameter search. Though they can use workflow tools in order to automate such tasks, it is difficult to describe some kind of workflows with them. They can also use script languages such as Perl, but it is hard for typical computational scientists to program in such a language. Therefore, we are developing a new language based on an existing script language that has additional features to enable us to describe such automation easily. We realize both flexibility and easiness to use by modularizing features, such as complicated search algorithms and limiting the number of simultaneously submitted jobs, as abstract classes of object oriented languages. Programmers can automate not only typical workflows easily by simply using provided modules but also more complicated workflows by modifying existing modules or developing new modules. This presentation shows an overview of our system, which includes a job scheduler as a backend, and a prototype of our script language.
  • 平石 拓, 岩下 武史, 中島 浩 研究報告ハイパフォーマンスコンピューティング(HPC) 2009 (14) 175 -180 2009年02月19日 [査読無し][通常論文]
     
    車体の設計や創薬等の計算科学における大規模シミュレーションを行う際,パラメータスイープや最適パラメータ探索のために,同一のジョブをパラメータを変えつつ,大量に繰り返し,あるいは並列に実行することが多い.このような処理を自動化する際,既存のワークフローツールを用いると簡便ではあるが汎用性に欠け, Perl 等の既存のスクリプト言語で記述するのは計算科学の研究者には一般に敷居が高い.そこで我々は,既存のスクリプト言語をベースとしつつ,上記の自動化を簡便に記述するための機能を追加したジョブ並列スクリプト言語を開発している.複雑な探索アルゴリズムや同時投入ジョブ数の制限等の機能はオブジェクト指向の抽象クラスとしてモジュール化する.ユーザは提供済みのモジュールをそのまま使うことも,必要に応じて改造したり新たに開発することもできるため,汎用性と簡便性が両立できる.本発表では,バックエンドとなるジョブスケジューラを含むシステムの全体像と言語のプロトタイプを示す.Computational scientists often perform large scale simulations in their research or development such as car body design and drug discovery. In such simulations, they often execute plenty of sequential and/or parallel jobs with different parameters for parameter sweep or optimal parameter search. Though they can use workflow tools in order to automate such tasks, it is difficult to describe some kind of workflows with them. They can also use script languages such as Perl, but it is hard for typical computational scientists to program in such a language. Therefore, we are developing a new language based on an existing script language that has additional features to enable us to describe such automation easily. We realize both flexibility and easiness to use by modularizing features, such as complicated search algorithms and limiting the number of simultaneously submitted jobs, as abstract classes of object oriented languages. Programmers can automate not only typical workflows easily by simply using provided modules but also more complicated workflows by modifying existing modules or developing new modules. This presentation shows an overview of our system, which includes a job scheduler as a backend, and a prototype of our script language.
  • 高橋 康人, 岩下 武史, 金澤 正憲, 若尾 真治 電気学会研究会資料. SA, 静止器研究会 2009 (1) 41 -46 2009年01月29日 [査読無し][通常論文]
  • 美舩 健, 高橋 康人, 岩下 武史 電気学会研究会資料. SA, 静止器研究会 2009 (1) 69 -74 2009年01月29日 [査読無し][通常論文]
  • Relationship between Folded Preconditioning and Coarse-Grid-Correctio
    Takeshi Mifune, Takeshi Iwashita, Yasuhito Takahas 15 th Intl. Conf. Finite Elements in Flow Problems (F EpF.0 91)2,1, 2009- 2009年 [査読有り][通常論文]
  • A New Preconditioning Technique for Linear Equations \nDerived from the Elimination of Redundant Unknowns in Singular Systems
    Takeshi Mifune, Yasuhito Takahashi, Takeshi Iwashita Applications, pp. 20-22, 2009 2009年 [査読有り][通常論文]
  • Preconditioning in Finite Element Analysis of Electro magnetic Field: A- φBlock IC Preconditioning
    Yasuhito Takahashi, Takeshi Mifune, Takeshi Iwashita Proc. 0f the 17th Intl. Conf. on the Computation of Electromagnetic Fields (COMPUMAG2009), pp. 1026 1027, 2009-11 2009年 [査読有り][通常論文]
  • 幾何マルチグリッド法を用いた有限要素電磁波解析の並列化に関する検討
    廣谷迪, 美舩健, 岩下武史 平成 21 年電気関係学会関西支部連合大会, G7-7, 2009-11. 2009年 [査読有り][通常論文]
  • 特異な線形方程式の正則化に伴う悪条件化を解消する新しい前処理
    美舩健, 高橋康人, 岩下武史 加速法ワー クショップ, T1-T4, 2009-11. 2009年 [査読有り][通常論文]
  • 高周波電磁界解析に対する複素シフトを用いた幾何マルチグリッド前処理についての検討
    廣谷迪, 美船健, 岩下武史 平成21年電気学会全国大会,5-154, 2009-3. 2009年 [査読有り][通常論文]
  • 辺要素有限要素法を用いた静磁界解析における代数マルチグリッド法の応用に関する検討
    石田智之, 美船健, 岩下武史 平成21年電気学会全国大会,5-152, 2009-3. 2009年 [査読有り][通常論文]
  • 高橋 康人, 岩下 武史, 金澤 正憲, 若尾 真治 情報処理学会研究報告. EVA, [システム評価] 2008 (119) 1 -6 2008年11月24日 [査読無し][通常論文]
     
    電磁界数値解析に基づく電気機器設計の高度化のためには,さまざまな数値解析手法の特長を活かし,対象に応じて使い分けることが重要だと考えられる。しかし,積分方程式法などいくつかの数値解析手法は,非対称な係数行列を扱わなければならない難点がある。近年,双直交条件に基づくBiCG法系統の反復法や,最小条件に基づくGMRES法とはまったく異なるクリロフ部分空間法であるIDR(s)法が提案され,さまざまな分野においてその性能評価が進められているが,電磁界数値解析分野においてはその有効性について不明な点も残されている。そこで本稿では,非対称マトリクスを扱う電磁界数値解析手法を対象として,従来用いられているGMRES(k)法やBiCGSTAB2法との比較を行い,IDR(s)法の有効性を検証する。
  • 井上 勲, 乾 義尚, 岩下 武史, 石川 本雄 電気学会研究会資料. FTE, 新エネルギー・環境研究会 2008 (1) 49 -54 2008年09月29日 [査読無し][通常論文]
  • 高橋 康人, 美舩 健, 岩下 武史, 金澤 正憲 電気学会研究会資料. SA, 静止器研究会 2008 (49) 71 -76 2008年09月18日 [査読無し][通常論文]
  • 高橋 康人, 徳増 正, 若尾 真治, 岩下 武史, 金澤 正憲 電気学会研究会資料. SA, 静止器研究会 2008 (49) 83 -88 2008年09月18日 [査読無し][通常論文]
  • 岩下 武史, 高橋 康人 シミュレーション 27 (3) 175 -179 2008年09月15日 [査読無し][通常論文]
  • 宋 仁煥, 高橋 康人, 岩下 武史, 金澤 正憲, 嶋吉 隆夫, 天野 晃, 松田 哲也 情報処理学会研究報告. EVA, [システム評価] 26 (76) 9 -14 2008年08月06日 [査読無し][通常論文]
     
    生命科学分野での研究の発展により,生体に関する膨大の知識が蓄積されてきたが,いまだ解明されていない生命現象が多い.このような現象を解明する研究手法としてシミュレーション技術が有効である.特に心臟を構成する心筋細胞において,多数の定量的モデルが構築されるようになってきている.これらの細胞モデルを利用することにより,計算機上で心筋組織に関する細胞レベルの定量的なシミュレーション実験が行われるようになってきた.しかしながら,シミュレーション実験において要素数が増大するにつれ,計算量も増大する問題が生じる.そのため,一定時間内に計算可能な要素数に限界がある.本研究ではMPIによる並列計算を利用し,Kyotoモデルによる興奮伝播シミュレーションに対する計算時間の短縮を行った.また,実心臟の心筋細胞数に近い要素数でモデルを構成した場合,シミュレーションに必要な計算時間を予測した.
  • Takeshi Iwashita, Takeshi Mifune, Masaaki Shimasaki IEEE TRANSACTIONS ON MAGNETICS 44 (6) 946 -949 2008年06月 [査読無し][通常論文]
     
    This paper proposes an implicit error correction method that corresponds to the explicit error correction methods, such as Hiptmair's hybrid smoother and the conventional multigrid method. The A-phi method can be seen as the implicit error correction method corresponding to the hybrid smoother. Numerical tests confirm that the A-phi method produces a similar correction effect on the error belonging to the kernel of the discrete curl operator as that of the hybrid smoother. Furthermore, this paper introduces an implicit correction multigrid method, which is the implicit error correction version of the conventional multigrid method. In this method, linear systems on all levels in a multigrid method are combined into a large linear system. This linear system is solved by an iterative solver, and any preconditioning techniques can be used. Numerical tests show that the proposed method involves coarse grid correction effects and achieves a convergence rate independent of the grid-size, thus confirming the effectiveness of the implicit error correction method.
  • 美舩 健, 岩下 武史, 村山 敏夫, 金子 祥宏, 大谷 秀樹 計算工学講演会論文集 13 (2) 667 -670 2008年05月19日 [査読無し][通常論文]
  • 荒井 宗範, 岩下 武史, 金澤 正憲 情報処理学会研究報告. EVA, [システム評価] 2008 (30) 49 -54 2008年03月19日 [査読無し][通常論文]
     
    本稿では, FitzHugh-Nagumo model を用いた心臓の興奮伝播シミュレーションの高速化について述べる.このような興奮伝播シミュレーションでは細胞膜内の電位のみを考慮するモノドメインモデル,細胞膜内外の電位を独立させて考えるバイドメインの2種の方法が存在するが,いずれの場合においても最終的に大規模な連立一次方程式を解くことに帰着される.今回はモノドメインモデルを用いたシミュレーションにおいて,並列化ICCG法(Incomplete Cholesky Conjugate Gradientmethod)を利用することで高速化を図る.ICCG法の並列化の阻害要因である前進・後退代入計算に対し2つの手法の有効性を検討した.
  • 美舩 健, 守口 聡一, 岩下 武史, 島崎 眞昭 電気学会研究会資料. MAG, マグネティックス研究会 2008 (13) 35 -40 2008年01月24日 [査読無し][通常論文]
  • Introduction of Explicit and Implicit Error Correction Methods
    Takeshi Iwashita, Takeshi Mifune, Masaaki Shimasaki International Kyoto-Forum on Krylov Subspace method, pp. 31-34,2008-9. 2008年 [査読有り][通常論文]
  • 偏平要素を含む有限要素解析における反復法の収束性改善のための新しい誤差修正法
    守口聡一, 美舩健, 岩下武史, 島崎眞昭 平成20年電気学会全国大会講演論文集,Vol.5, 5-187,p. 278, 2008-3. 2008年 [査読有り][通常論文]
  • 藤原 耕二, 亀有 昭久, 若尾 真治, 高橋 康人, 五十嵐 一, 松尾 哲司, 岩下 武史, 村松 和弘, 岡本 吉史, 山田 隆, 河瀬 順洋, 山崎 克巳, 平田 勝弘 電気学会研究会資料. SA, 静止器研究会 2007 (54) 91 -97 2007年09月20日 [査読無し][通常論文]
  • 岩下 武史, 美舩 健, 島崎 眞昭 情報処理学会論文誌. コンピューティングシステム 48 (8) 1 -10 2007年05月15日 [査読無し][通常論文]
     
    マルチグリッド法において,スムージング,補間・制約演算を陽的に行わない新しい方法:陰的マルチグリッド法を提案する.同手法では,マルチグリッド法における各レベルの方程式を統合化し,1つの大きな連立一次方程式として主に前処理付きクリロフ部分空間反復法により解く.その結果,従来のマルチグリッド解法の応用範囲を広げ,様々な前処理手法との併用が可能となる.同手法の基礎概念,実装法を記述し,その有効性について電磁界解析における反復法の性質との類似性から説明する.さらに,差分解析による数値解析において,同手法がコースグリッドコレクションの効果を有し,グリッドサイズによらない収束性を実現していることを示す.
  • 美舩 健, 小畑 信彦, 岩下 武史 計算工学講演会論文集 12 (2) 635 -638 2007年05月 [査読無し][通常論文]
  • Takeshi Iwashita, Takeshi Mifune, Masaaki Shimasaki IEEE TRANSACTIONS ON MAGNETICS 43 (4) 1493 -1496 2007年04月 [査読無し][通常論文]
     
    This paper introduces a simple way to evaluate the preconditioning effect in the shifted ICCG method. The proposed evaluation index is easily calculated with little additional memory in an incomplete factorization process; thus, it can be used for setting appropriate parameters for the solver, such as an acceleration factor and the ordering of unknowns, prior to the time-consuming iteration process. Numerical results show that the evaluation index gives the good estimate of the number of iterations necessary for convergence.
  • 美舩 健, 松尾 哲司, 岩下 武史, 島崎 眞昭 電気学会研究会資料. SA, 静止器研究会 2007 (17) 13 -18 2007年01月26日 [査読無し][通常論文]
  • モルタル有限要素法を用いた電動機解析の代数マルチグリッド法 による高速化
    美船健, 松尾哲司, 岩下武史, 島崎眞昭 第16 回MAGDA コンファレンス, D01, pp. 139-142, 2007-11. 2007年 [査読有り][通常論文]
  • “Fast Linear Solver for Heart Simulation on a Shared-Memory Parallel Computer"
    Takeshi Iwashita, Munenori Arai, Masanori Kanazawa, Takao Shimayashi, Akira Amano, Tetsuya Matsuda in Proc. 41h International Symposium of Cell/Biodynamics Simulation Project, 2007-11. 2007年 [査読有り][通常論文]
  • Shimayoshi Takao, Komurasaki Kazuhiro, Amano Akira, Iwashita Takeshi, Matsuda Tetsuya, Kanazawa Masanori Information and Media Technologies 2 (1) 144 -153 2007年 [査読無し][通常論文]
     
    The development of physiological cell models to support the understanding of biological mechanisms gains increasingly importance. Due to the complexity of biological systems, whole cell models, which are composed of many imported component models of functional elements, get quite complex, making modifications difficult. Here, we propose a method to enhance structural changes of cell models, employing the markup languages of CellML and our original PMSML (Physiological Model Structure Markup Language), in addition to a new ontology for cell physiological modelling, the Cell Model Ontology. In particular, a method to make references from CellML files to the ontology and a method to assist with manipulation of model structures using PMSML together with the Cell Model Ontology are reported. Using these methods two software utilities, an interactive ontology ID assigner, the CellML Ontologizer, and a graphical cell model editor, the Cell Structure Editor, are implemented. Experimental results proved that the proposed method and the implemented software are useful for the modification of physiological models.
  • Shimayoshi Takao, Komurasaki Kazuhiro, Amano Akira, IWASHITA TAKESHI, MATSUDA TETSUYA, KANAZAWA MASANORI 情報処理学会論文誌. SIG 47 (17) 83 -92 2006年11月 [査読無し][通常論文]
     
    The development of physiological cell models to support the understanding of biological mechanisms gains increasingly importance. Due to the complexity of biological systems, whole cell models, which are composed of many imported component models of functional elements, get quite complex, making modifications difficult. Here, we propose a method to enhance structural changes of cell models, employing the markup languages of CellML and our original PMSML (Physiological Model Structure Markup Language), in addition to a new ontology for cell physiological modelling, the Cell Model Ontology. In particular, a method to make references from CellML files to the ontology and a method to assist with manipulation of model structures using PMSML together with the Cell Model Ontology are reported. Using these methods two software utilities, an interactive ontology ID assigner, the CellML Ontologizer, and a graphical cell model editor, the Cell Structure Editor, are implemented. Experimental results proved that the proposed method and the implemented software are useful for the modification of physiological models.
  • 井上 勲, 乾 義尚, 岩下 武史, 石川 本雄 電気学会研究会資料. FTE, 新エネルギー・環境研究会 2006 (6) 61 -66 2006年10月27日 [査読無し][通常論文]
  • 岩下 武史, 美舩 健, 島崎 眞昭 電気学会研究会資料. SA, 静止器研究会 2006 (58) 49 -54 2006年08月24日 [査読無し][通常論文]
  • 小畑 信彦, 美舩 健, 岩下 武史, 島崎 眞昭 電気学会研究会資料. SA, 静止器研究会 2006 (58) 55 -60 2006年08月24日 [査読無し][通常論文]
  • 美舩 健, 岩下 武史, 島崎 眞昭 電気学会研究会資料. SA, 静止器研究会 2006 (58) 61 -66 2006年08月24日 [査読無し][通常論文]
  • 島崎 眞昭, 松尾 哲司, 岩下 武史, 美舩 健 電気学会研究会資料. SA, 静止器研究会 2006 (58) 95 -100 2006年08月24日 [査読無し][通常論文]
  • 松尾 哲司, 広中 悠樹, 岩下 武史, 島崎 眞昭 情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2006 (87) 7 -12 2006年07月31日 [査読無し][通常論文]
     
    強磁性体内の磁壁移動などミクロな現象が,複雑なマクロ磁気特性に及ぼす影響を記述するため,大規模マイクロ磁気学計算を行うことが考えられる。しかし,この手法ではその計算コストが莫大となるため,PCクラスタおよびグリッド環境下で並列マイクロ磁気学計算を行い,計算時間の短縮と解析領域の拡大を図るための予備的検討を行った。その結果,PCクラスタでは,16台で約10の速度向上率が得られた。Globus ToolkitとMPICH-G2を用いたグリッド環境下でもある程度の速度向上率が得られた。
  • 岩下 武史, 美舩 健, 島崎 眞昭 情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2006 (87) 151 -156 2006年07月31日 [査読無し][通常論文]
     
    マルチグリッド法において,補間・制約演算を陽的に行わない新しい方法:陰的マルチグリッド法を提案する.同手法では,マルチグリッド法における各レベルの方程式を統合し,一つの大きな連立一次方程式として主に前処理付きクリロフ部分空間反復法により解く.その結果,従来のマルチグリッド法の適用範囲を広げ,様々な前処理手法との併用が可能となる.同手法の有効性について電磁界解析における反復法の性質と本手法の類似性から説明し,数値解析により同手法がコースグリッドコレクションの効果を有することを示す.
  • 嶋吉 隆夫, 小紫 和宏, 天野 晃, 岩下 武史, 松田 哲也, 金澤 正憲 情報処理学会研究報告. BIO, バイオ情報学 5 (64) 17 -22 2006年06月15日 [査読無し][通常論文]
     
    生命現象の解明のためには,細胞機能要素のモデルを統合した細胞生理学モデルの構築が重要である.我々が開発している細胞モデル構造編集ツールが持つ編集支援機能を利用するためには,既存モデルをオントロジーに対応づける必要がある.そこで,我々は細胞生理学モデルをオントロジーに対応させる一手法を提案する.本手法では,字句解析およびモデル構造の解析を用いて,モデル中の機能要素および変数のオントロジーエントリへの対応を推定する.提案手法を用いた実験結果は提案手法が有効であることを示している.さらに,オントロジー対応化したモデルと細胞モデル構造編集ツールを用いて実験を行い,効率よく複雑なモデルを構築することが可能であることを示した.
  • 吉森 正, 岩下 武史, 金澤 正憲 情報処理学会研究報告. EVA, [システム評価] 2006 (32) 25 -30 2006年03月20日 [査読無し][通常論文]
     
    心臓の興奮伝播シミュレーションにおいて,大規模な連立一次方程式を効率良く解くことはシミュレーションの高速化に必要不可欠な要素である.大規模疎行列を係数行列とする連立一次方程式の場合,直接解法で解くよりも反復解法を用いて解く方が効率良く解くことができる.本稿では,神経細胞の膜の興奮の伝達を表すFitz-Hugh-Nagumo (FHN)モデルを用いた心臓の興奮伝播シミュレーションにおける線形反復解法の高速化を並列計算アルゴリズムと大型計算機を用いたハイパフォーマンスコンピューティングの両面から行った.心筋の結合組織で心筋細胞ネットワークの導電率特性を表すモノドメインモデルを実装して,その細胞モデル(興奮膜モデル)にはFHNモデルを用いた.モノドメインモデルの興奮伝播方程式を,差分解法で離散化し,得られた連立一次方程式を並列化SSOR-CG法の一つであるJSOR-CG法によって並列計算機上で解いた.シミュレーション実験の結果により本手法の有効性が示された.
  • 岩下 武史, 島崎 眞昭 情報処理学会論文誌. コンピューティングシステム 47 (3) 40 -48 2006年03月15日 [査読無し][通常論文]
     
    クリロフ部分空間反復法の代表的な前処理手法である不完全LU分解前処理は,未知数のオーダリングの影響を受けることが知られている.著者らは最近,これらのオーダリングが前処理効果に及ぼす影響を簡単に評価する評価指標を提案した.本論文では,前処理効果の見積りが難しいと考えられている非構造解析において,評価指標を提示することを試みる.本評価指標はRemainder matrixのノルムと限定された条件の下で相関関係を持ち,ILU分解と同程度の計算量で追加的なメモリ量をほとんど必要とすることなく計算される.Matrix Marketより入手した係数行列データ,ポアソン方程式の差分解析,3次元電磁場解析を例にとり,対称行列用のILU分解前処理を用いるICCG(0)法における本手法の有効性について検証する.その結果,提案指標により,より少ないメモリ量で既存の代表的指標であるRemainder matrixのフロベニスノルムと同等の前処理効果の評価が可能であることが示された.
  • ”Basic Concept of New Multigrid Type Iterative Method: Implicit Multigrid Method”,
    Takeshi Iwashita, Takeshi Mifune, Msaaki Shimasaki 日本応用数理学会2006 年度年会講演予稿集, pp. 130-131 2006年 [査読有り][通常論文]
  • T. Shimayoshi, K. Komurasaki, A. Amano, T. Iwashita, M. Kanazawa, T. Matsuda Annual International Conference of the IEEE Engineering in Medicine and Biology - Proceedings 1 4171 -4174 2006年 [査読有り][通常論文]
  • ランダムスパース係数行列に対する不完全コレスキー分解前処理におけるオーダリングの評価指標(共著)
    情報処理学会論文誌:コンピューティングシステム 47巻, SIG3(ACS13)号, pp. 40-48 2006年 [査読無し][通常論文]
  • 岩下 武史, 金澤 正憲, 杉崎 由典, 青木 正樹 情報処理学会研究報告. EVA, [システム評価] 2005 (118) 25 -30 2005年11月22日 [査読無し][通常論文]
     
    多色順序付け法による並列化ICCG法ソルバによるベンチマークプログラムにより, SMPクラスタ型並列計算機HPC2500を評価する.同手法は, 主記憶に対してストライドアクセスもしくはランダムアクセスを行う.こうしたメモリアクセスは, 必ずしもキャッシュをベースとしたメモリの階層構造には適合しないが, 実用上の解析においてよく見られる.解析では, 主記憶に対するストライドアクセスにおけるストライド幅やプロセッサ数の増加に対して, HPC2500の計算性能がどのような振る舞いを行うか検証する.
  • J Nonaka, N Kukimoto, Y Ebara, M Ogata, T Iwashita, M Kanazawa, K Koyamada IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E88D (11) 2582 -2590 2005年11月 [査読無し][通常論文]
     
    Volume Graphics Clusters (VG Clusters) have proven to be efficient in a wide range of visualization applications and have also shown promise in some other applications where the image composition device could be fully utilized. The main differentiating feature from other graphics clusters is a specialized image composition device, commercially available as the MPC Image Compositor, which enables the building of do-it-yourself VG Clusters. Although this device is highly scalable, the unidirectional composition flow limits the data subdivision to the quantity of physically available rendering nodes. In addition, the limited buffer memory limits the maximum capable image composition size, therefore limiting its use in large-scale data visualization and high-resolution visualization. To overcome these limitations, we propose and evaluate an image composition mechanism in which additional hardware is used for assisting the image composition process. Because of the synergistic use of two distinct image composition hardware devices we named it "Hybrid Image Composition". Some encouraging results were obtained showing the effectiveness of this solution in improving the VG Cluster 's potential. A low-cost parallel port based hardware barrier is also presented as an efficient method for further enhancing this kind of small-scale VG Cluster. Moreover, this solution has proven to be especially useful in clusters built using low-speed networks, such as Fast Ethernet, which are still in common use.
  • 小紫 和宏, 嶋吉 隆夫, 天野 晃, 岩下 武史, 松田 哲也, 金澤 正憲 電子情報通信学会技術研究報告. MBE, MEとバイオサイバネティックス 105 (335) 57 -60 2005年10月14日 [査読無し][通常論文]
     
    精密な生体シミュレーションの実現には, 高精度な細胞のモデルを実現することが重要である.細胞モデルの構築及び編集作業には生理学及び情報科学の専門知識が必要であり, また複雑な編集作業が必要になる.本研究では, 細胞モデル編集ツールにおいて, 情報科学の専門知識を有しない生物研究者が細胞モデル構築を行う際に, 作業の効率化に有効な支援機能を検討した.更に, 支援機能を実現するために必要な知識情報について検討を行い, これらの知識情報を表現するために用いる細胞生理学オントロジーを提案する.
  • T Mifune, T Iwashita, M Shimasaki IEEE TRANSACTIONS ON MAGNETICS 41 (5) 1660 -1663 2005年05月 [査読無し][通常論文]
     
    This paper presents a parallel algebraic multigrid (AMG) solver for linear systems of equations arising in magnetic finite edge-element analyses. To parallelize the smoothing process, which consumes most of the computational costs of the AMG algorithm, we apply multicolor (MC) ordering to the symmetric Gauss-Seidel (SGS) method. Advantages of MC ordering are: 1) that the number of processors employed does not affect the convergence of the approximate solution and 2) that only the information of the coefficient matrix is utilized to parallelize the smoother. The numerical results show that the developed solver achieves sufficient scalability in magnetic finite edge-element analyses.
  • ノナカ ジョルジ, 岩下 武史, 金澤 正憲 情報処理学会研究報告. EVA, [システム評価] 2005 (34) 25 -30 2005年03月23日 [査読無し][通常論文]
     
    VGクラスタとは産総研と三菱プレシジョンが共同開発した可視化機能を強化したPCクラスタのことである.従来の画像重畳プロセスを専用装置で高速化しているのが特徴である.高速画像重畳処理を実現しているが重畳プロセス毎にバリア同期を行う必要がある.この装置自体バリア同期機構を持ち合わせていないためMPI_Barrierの様なソフトウェアバリアを利用する必要がある.このバリア同期オーバーヘッドを軽減する目的でパラレルポートを利用した低コストハードウェアバリア装置の利用を試みた.本報告ではこの装置を実装した9ノードVGクラスタの性能評価について述べる.今回は小規模クラスタで有効性を確認したが同じように大規模VGクラスタでも性能向上が期待できる.
  • 伊藤 貴之, 清 豪, 小山田 耕二, 酒井 晃二, 岩下 武史, 金澤 正憲 可視化情報学会誌. Suppl. 25 (1) 131 -134 2005年03月15日 [査読無し][通常論文]
  • 越本 浩央, 金澤 正憲, 岩下 武史 情報処理学会研究報告. 計算機アーキテクチャ研究会報告 2005 (19) 19 -24 2005年03月07日 [査読無し][通常論文]
     
    グリッドコンピューティングの基盤を支えるミドルフレームワークが充実し, ウェブサービスとの統合による応用面が注目されている. しかし仕様の複雑さと規模の大きさが開発と利用を困難にしている. 本研究ではこの二つの問題を解決するために, RESTアーキテクチャに基づいたグリッドサービスの設計を提案し, モナドベースのRESTfulウェブサービスを構築する. RESTアーキテクチャはネットワーク上のエンドポイントのステートレス化を推し進める. またモナドはデータと計算と計算戦略を切り離すことで計算結果への参照透明性を提供する. ここではモナドを利用することでの開発の効率化とRESTfulなサービスの運用の利便性を示す.
  • 越本 浩央, 金澤 正憲, 岩下 武史 情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2005 (19) 19 -24 2005年03月07日 [査読無し][通常論文]
     
    グリッドコンピューティングの基盤を支えるミドルフレームワークが充実し, ウェブサービスとの統合による応用面が注目されている. しかし仕様の複雑さと規模の大きさが開発と利用を困難にしている. 本研究ではこの二つの問題を解決するために, RESTアーキテクチャに基づいたグリッドサービスの設計を提案し, モナドベースのRESTfulウェブサービスを構築する. RESTアーキテクチャはネットワーク上のエンドポイントのステートレス化を推し進める. またモナドはデータと計算と計算戦略を切り離すことで計算結果への参照透明性を提供する. ここではモナドを利用することでの開発の効率化とRESTfulなサービスの運用の利便性を示す.
  • 岩下 武史, 島崎 眞昭 情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2005 (19) 109 -114 2005年03月07日 [査読無し][通常論文]
     
    クリロフ部分空間反復法の代表的な前処理手法である不完全LU分解前処理は, 未知数のオーダリングの影響を受けることが知られている. 著者らは最近, これらのオーダリングが前処理効果に及ぼす影響を簡単に評価する評価指標を提案した. 本論文では, 前処理効果の見積もりが難しいと考えられている非構造解析において, 評価指標を提示することを試みる. 本評価指標はRemainder matrixのノルムと限定された条件の下で相関関係を持ち, ILU分解と同程度の計算量で追加的なメモリ量をほとんど必要とすることなく計算される. Matrix marketより入手した行列データ, ポアソン方程式の差分解析, 3次元電磁場解析を例に取り, 本手法の有効性について検証する.
  • 金澤 正憲, 岩下 武史, Nonaka Jorji シンポジウム報告集 (3) 13 -16 2005年03月 [査読無し][通常論文]
  • Visualization of Multi Parameter Hierarchical Data Using Automatic Dominant Parameter Determination Technique
    Takeru Kiyoshi, Takayuki Itoh, Koji Koyamada, Koji Sakai, Takeshi Iwashita, Masanori Kanazawa NICOGRAPH International 2005, pp.31-35 2005年 [査読有り][通常論文]
  • 準定常有限要素磁界解析における代数マルチグリッド法 とICCG 法の比較
    友藤大輔, 美舩健, 岩下武史, 島崎眞昭 平成17 年電気関係学会関西支部連合大会講演論文集, 2005-11. 2005年 [査読有り][通常論文]
  • 節点要素および辺要素を用いた有限要素磁界解析における AMGCG 法の並列化に関する検討
    小畑信彦, 美舩健, 岩下武史, 島崎眞昭 平成17 年電気関係学会関西支部連合大会講演論文集, 2005-11. 2005年 [査読有り][通常論文]
  • T Iwashita, Y Nakanishi, M Shimasaki SIAM Journal on Scientific Computing 26 (4) 1234 -1260 2005年 [査読無し][通常論文]
     
    This paper introduces block red-black ordering in a general three-dimensional form for parallel incomplete LU (ILU) preconditioning. This parallel ordering method is designed to attain fast convergence with reduced synchronization among processors in parallelized forward and backward substitutions. In this method, the grid-nodes are divided into blocks and red-black ordering is applied to them. Since blocks with identical colors never have a data-dependency, the blocks in each color can be processed in parallel. Moreover, in order to compare parallel orderings, we propose a new tool for investigating orderings on convergence. The analytic index for convergence, which is based on the remainder matrix, is easily computed and has a unique value for a fixed ordering. Nodes are classified into seven groups, and the effect of each group on convergence is estimated. Numerical tests using a three-dimensional problem confirm the validity of both proposed parallel ordering and analytic convergence comparison methods.
  • Jorji Nonaka, Nobuyuki Kukimoto, Yasuo Ebara, Takeshi Iwashita, Masanori Kanazawa, Koji Koyamada Journal of the Institute of Image Electronics Engineers of Japan 34 (3) 245 -255 2005年 [査読無し][通常論文]
     
    Acceleration methods based on bounding volumes have been widely recognized as an efficient approach for diminishing volume rendering time by eliminating unnecessary computations. Objects inside the volume data are enclosed by various shapes in order to delimit the range for volume rendering, thus avoiding unnecessary calculation. This paper presents an approach for accelerating pure software-based volume rendering by using object boundary projection and parallel processing techniques. Object boundary projection is a variant of the bounding volume method and works by extracting the tight object boundary information and projecting it onto the image space plane in order to obtain the effective range, both in image and object space for efficient volume rendering. We optimized the original object boundary projection algorithm and added other facilities such as macro-cell projection and parallel processing. An efficient load-balancing scheme for image-space data distribution which takes into consideration the boundary information is also presented and these were evaluated on a distributed-memory parallel architecture machine. We obtained some encouraging results which show the effectiveness of this acceleration approach by diminishing volume rendering time without sacrificing the rendered image quality. © 2005, The Institute of Image Electronics Engineers of Japan. All rights reserved.
  • T Iwashita, Y Nakanishi, M Shimasaki SIAM JOURNAL ON SCIENTIFIC COMPUTING 26 (4) 1234 -1260 2005年 [査読無し][通常論文]
     
    This paper introduces block red-black ordering in a general three-dimensional form for parallel incomplete LU (ILU) preconditioning. This parallel ordering method is designed to attain fast convergence with reduced synchronization among processors in parallelized forward and backward substitutions. In this method, the grid-nodes are divided into blocks and red-black ordering is applied to them. Since blocks with identical colors never have a data-dependency, the blocks in each color can be processed in parallel. Moreover, in order to compare parallel orderings, we propose a new tool for investigating orderings on convergence. The analytic index for convergence, which is based on the remainder matrix, is easily computed and has a unique value for a fixed ordering. Nodes are classified into seven groups, and the effect of each group on convergence is estimated. Numerical tests using a three-dimensional problem confirm the validity of both proposed parallel ordering and analytic convergence comparison methods.
  • 岩下 武史, 島崎 眞昭 シンポジウム報告集 (2) 40 -45 2004年03月 [査読無し][通常論文]
  • 輪郭投影法と並列化によるボリュームレンダリングの高速化
    ノナカ ジョルジ, 岩下武史, 金澤正憲, 小山田耕二 ビジュアルコンピューティングワークショップ2004in白浜 2004年 [査読有り][通常論文]
  • A fast AMG solver for electromagnetic finite edge-element analyses on shared memory parallel computers
    T. Mifune, T. Iwashita, M. Shimasaki PIERS 2004 - Progress in Electromagnetics Research Symposium, Extended Papers Proceedings 305 -308 2004年 [査読有り][通常論文]
  • 三次元有限要素磁界解析のための多色順序付けを用いた並列代数マルチグリッド解法
    美舩健, 岩下武史, 島崎眞昭 日本応用数理学会2004 年年会講演予稿集, pp. 404-405 2004年 [査読有り][通常論文]
  • ノナカ ジョルジ, 小山田 耕二, 岩下 武史, 金澤 正憲 可視化情報学会誌. Suppl. 23 (1) 385 -386 2003年07月01日 [査読無し][通常論文]
  • T Mifune, T Iwashita, M Shimasaki IEEE TRANSACTIONS ON MAGNETICS 39 (3) 1670 -1673 2003年05月 [査読無し][通常論文]
     
    Algebraic multigrid (AMG) methods were originally developed for linear systems of equations with symmetric coefficient matrices. The objective of this paper is to investigate the applicability of the AMG solvers in electromagnetic finite-element analyses, which, lead to nonsymmetric matrices. The excellent performances of the AMG solvers are demonstrated in (two-dimensional and three-dimensional) electromagnetic analyses of a magnetohydrodynamic generator and in a three-dimensional eddy-current analysis including a moving conductor.
  • T Iwashita, M Shimasaki IEEE TRANSACTIONS ON MAGNETICS 39 (3) 1713 -1716 2003年05月 [査読無し][通常論文]
     
    This paper proposes a new parallelized incomplete Cholesky conjugate gradient (ICCG) solver effective on a small-scale multiprocessor system. The new method is based on a new reordering technique, namely the block red-black ordering method. Its parallel performance is evaluated in a finite edge-element eddy-current analysis. A numerical test shows that the proposed method is effective on a small, number of processors due to fast convergence and low communication costs.
  • T Mifune, Iwashita, I, M Shimasaki IEEE TRANSACTIONS ON MAGNETICS 39 (3) 1677 -1680 2003年05月 [査読無し][通常論文]
     
    The algebraic multigrid (AMG) method is an algebraic multilevel solver for linear systems of equations, which stem from the discretization of partial differential equations. This paper develops an efficient AMG solver for singular linear systems of equations arising from electromagnetic finite element (FE) analyses using edge elements. The presented solver can solve singular equations using a technique similar to the shifted incomplete Cholesky conjugate gradient method.. Shifted global coefficient matrices. are utilized to construct the AMG preconditioner. The numerical results show that the proposed AMG conjugate gradient (AMGCG) solver can converge with a wide range of "shift.".
  • 島崎 眞昭, 岩下 武史, 美船 健 数理解析研究所講究録 1320 162 -170 2003年05月 [査読無し][通常論文]
  • 岩下 武史, 中西 佑一, 島崎 眞昭 情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2003 (29) 95 -100 2003年03月11日 [査読無し][通常論文]
     
    クリロフ部分空間反復法の代表的な前処理は,未知数のオーダリングの影響を受けることが知られている.本論では,オーダリングが前処理効果(反復法の収束性)に与える影響に関する新しい評価手法を提案する.新しい評価指標はRemainder matrixの行列ノルムと相関関係を持つ.ランダムオーダリング,多色順序付け,ブロック化赤-黒順序付けによる数値実験により新しぃ評価手法を検証する.主に数値実験の結果,新しい評価法の有用性とともに,プロック化赤-黒順序付け法の3次元問題,非対称問題での有用性を示す.
  • 平野 彰雄, 小西 龍一, 岩下 武史 シンポジウム報告集 (1) 27 -36 2003年03月 [査読無し][通常論文]
  • 岩下 武史, 中西 佑一, 島崎 眞昭 シンポジウム報告集 (1) 99 -105 2003年03月 [査読無し][通常論文]
  • Nonaka Jorji, 小山田 耕二, 岩下 武史 シンポジウム報告集 (1) 106 -114 2003年03月 [査読無し][通常論文]
  • T Iwashita, M Shimasaki INTERNATIONAL JOURNAL OF PARALLEL PROGRAMMING 31 (1) 55 -75 2003年02月 [査読無し][通常論文]
     
    A parallel ordering technique is a typical strategy for parallelization of the ICCG method. This paper proposes a new parallel ordering method to develop a parallel ICCG solver utilizing fewer synchronization points and achieving a high convergence rate. The new parallel ordering is called "block red-black ordering". In this method, nodes in an analyzed grid are divided into several or many blocks, and red-black ordering is applied to the blocks. Since the blocks with an identical color are independent of each other, forward and backward substitutions in the ICCG iteration can be parallelized in each color. The new method has the advantage that only one synchronization point exists in each parallelized substitution. In order to evaluate the convergence and the parallel speed-up of the method, we carried out an analytical investigation using the ordering graph theory and numerical tests on a scalar parallel computer. The analytical study shows that the convergence rate is improved by an increase in the number of nodes of one block and that an optimal block size for getting the best convergence rate is easily set. The numerical tests show that the new method achieves a high parallel speed-up rate due to fast convergence, small synchronization costs, and effective utilization of the data cache on a scalar parallel computer.
  • Parallel Image-Order Boundary-Projected Ray-Casting
    Nonaka J, Watashiba Y, Kukimoto N, Sakamoto N, Koyamada K, Iwashita T, Kanazawa M The 3rd IASTED International Conference Visualization, Imaging, and Image Processing (VIIP 2003), pp. 779-784 2003年 [査読有り][通常論文]
  • M Shimasaki, T Iwashita, T Mifune JOURNAL OF COMPUTATIONAL AND APPLIED MATHEMATICS 149 (1) 341 -349 2002年12月 [査読無し][通常論文]
     
    Solving linear equations plays a crucial role in high performance electromagnetic field analysis. We describe forms and characteristics of a system of linear equations arising in electromagnetic field analysis with finite element method (FEM). Properties of ICCG and its parallelization are discussed in context of electromagnetic field analyses. Although current applicability of multigrid approach is rather limited in electromagnetic field analysis in comparison with ICCG, the multigrid method is important because it is quite fast when applied to very large-scale problems. We discuss the algebraic multigrid method in finite element electromagnetic field analysis. (C) 2002 Elsevier Science B.V. All rights reserved.
  • 岩下 武史, 島崎 眞昭 電気学会研究会資料. RM, 回転機研究会 2002 (58) 43 -48 2002年09月02日 [査読無し][通常論文]
  • 美舩 健, 岩下 武史, 島崎 眞昭 計算工学講演会論文集 7 (2) 727 -730 2002年05月20日 [査読無し][通常論文]
  • T Iwashita, M Shimasaki IEEE TRANSACTIONS ON MAGNETICS 38 (2) 429 -432 2002年03月 [査読無し][通常論文]
     
    This paper proposes a new black-box-type parallel processing method for the incomplete Cholesky conjugate gradient (ICCG) solver. The new method is based on a multicolor ordering concept and an automatic reordering process in the solver. Parallel performance is evaluated in the context of three-dimensional finite edge-element eddy-current analysis. The proposed method attains high parallelism with a small increase in CG iterations and achieves high parallel performance.
  • T Mifune, T Iwashita, M Shimasaki IEEE TRANSACTIONS ON MAGNETICS 38 (2) 369 -372 2002年03月 [査読無し][通常論文]
     
    The algebraic multigrid (AMG) method is an efficient solver for linear systems arising in finite element analyses. The AMG method is applicable at a matrix level, different from the geometric multigrid solvers. This paper proposes a combination of the parallel processing technique and the AMG method as a fast solver for electromagnetic field analyses. While the AMG method consists of a setup phase and a solution phase, parallel processing of the former phase is difficult. We present the use of long-range interpolation instead of the conventional direct interpolation for improvement of the parallel efficiency of the AMG setup phase. A magnetostatic analysis and an eddy-current analysis show the solver performance. The numerical results show that parallelized AMG is a fast solver and has sufficient scalability, as compared with the conventional solver.
  • 岩下 武史, 金澤 正憲, 島崎 眞昭 情報基盤センター年報 2 55 -62 2002年03月 [査読無し][通常論文]
  • T Iwashita, M Shimasaki IEEE TRANSACTIONS ON MAGNETICS 37 (5) 3498 -3502 2001年09月 [査読無し][通常論文]
     
    The present paper proposes a new method for the construction and ordering of edge elements for parallel computation. The use of virtual nodes generated in each volume element is presented as a means of introducing parallel ordering theory developed in finite difference analyses to finite edge element analyses. Eight-corner ordering and multi-color ordering are examined in the context of 3-D eddy-current analysis. The proposed method using 8-corner ordering can parallelize the ICCG solver in a finite edge element analysis without decreasing the convergence rate. A good balance between convergence and parallelism in the ICCG solver is obtained in the case of multi-color ordering.
  • T Iwashita, M Shimasaki IEEE TRANSACTIONS ON MAGNETICS 36 (4) 1504 -1509 2000年07月 [査読無し][通常論文]
     
    A new parallelized ICCG scheme is applied to a finite edge element analysis of a 3-d eddy current problem with a moving conductor, In the new method, the global matrix is automatically reordered to the matrix form appropriate to parallel processing. The method requires no particular pre-processing step. It is shown that the newly proposed method has a better parallel efficiency than the Block ICCG method because of a higher preconditioning effect.
  • 岩下 武史, 曽我部 亮, 美船 健, 島崎 眞昭 計算工学講演会論文集 5 (1) 393 -396 2000年05月24日 [査読無し][通常論文]
  • T Iwashita, T Mifune, R Sokabe, M Shimasaki INTERNATIONAL CONFERENCE ON PARALLEL COMPUTING IN ELECTRICAL ENGINEERING - PARELEC 2000, PROCEEDINGS 203 -207 2000年 [査読無し][通常論文]
     
    3-D Eddy current analyses are performed with parallelized ICCG solvers. In order to parallelize the ICCG solver, the present analysis uses the Block ICCG method (BICCG) and the Parallelized ICCG method with renumbering process (PICCG-RP) that is proposed by the authors. In the latter method, the global matrix is reordered to the matrix form appropriate to parallel processing. The parallel efficiencies of the solvers are evaluated. It is shown that the PICCG-RP can solve the eddy current problem more efficiently than the BICCG. We also propose the special renumbering process in the PICCG-RP for dual-processor machines.
  • Fault Analysis of Interconnecting System Between Commercial-Scale Subsonic Diagonal Type MHD Generator and AC Power System
    The Transactions of The Institute of Electrical Engineers of Japan 120 (3) 426 -432 2000年 [査読無し][通常論文]
  • Effects of Faults of Interconnecting System on Subsonic Diagonal Type MHD Generator
    Proceeding of the 1998 International Symposium on Advanced Energy Technology 531 -538 1998年 [査読無し][通常論文]
  • T Iwashita, Y Inui, T Matsuo, J Umoto, M Ishikawa POWERCON '98: 1998 INTERNATIONAL CONFERENCE ON POWER SYSTEM TECHNOLOGY - PROCEEDINGS, VOLS 1 AND 2 2 1183 -1187 1998年 [査読無し][通常論文]
     
    Fault analyses are carried out for an interconnecting system of subsonic diagonal type MHD generator and AC power system. When lines faults such as single-line ground fault occur in the transmission line, inverters are short-circuited and load currents of the MHD generator increase much. Some control of firing angle is required to recover the normal inverter operation. The interconnecting system can be restored to the nominal condition after the recovery of normal inverter operation.
  • Stabilization Analysis of Commercial-Scale Subsonic Diagonal Type MHD Generator Considering Loading Condition
    The Transactions of The Institute of Electrical Engineers of Japan 118 (6) 643 -649 1998年 [査読無し][通常論文]
  • M Ishikawa, T Iwashita, J Tong ENERGY CONVERSION AND MANAGEMENT 38 (5) 499 -510 1997年03月 [査読無し][通常論文]
     
    A coal-fired MHD generator with 25 MW thermal input was designed and constructed at the Institute of Electrical Engineering (IEE), Chinese Academy of Sciences, in 1991. The present paper shows numerical analyses of the Chinese Faraday channel with a time-dependent 1-D gasdynamical model and 2-D electrodynamical model. The three key parameters of electrical behavior of the present MHD Faraday channel are evaluated with the analysis of the experimental data. The effective electrical conductivity is 5/9 of the theoretical value, the leakage resistance in the x-direction is 0.024 Ohm between cathodes and the leakage resistance in the gamma-direction is 82.4 Ohm, which can give close values of experimental results. (C) 1997 Elsevier Science Ltd. All rights reserved.
  • The Transactions of The Institute of Electrical Engineers of Japan 117 (6) 864 -871 1997年 [査読無し][通常論文]
  • 石川 本雄, 岩下 武史, JIANZHONG Tong 研究発表会講演論文集 = / Japan Society of Energy and Resources 15 115 -120 1996年04月16日 [査読無し][通常論文]
  • Preliminary Analyses of Coal-Fired MHD Power Experients Carried Out at IEE, China
    27th AIAA Plasmadyanics and Lasers Conference AIAA 96 -2344 1996年 [査読無し][通常論文]
  • The Transactions of The Institute of Electrial Engineers of Japan 116 (8) 973 -978 1996年 [査読無し][通常論文]
  • Numerical Analysis of 25 HWth Coal-Fired MHD Generator at IEE, China
    Proceedings of 33rd Symposium on Engineering Aspects of Magnetohydrodynamics 2,3,1-2,3,12 1995年 [査読無し][通常論文]

書籍等出版物

講演・口頭発表等

  • High performance multi-threaded ILU-GMRES solver with algebraic block multi-color ordering  [通常講演]
    Takeshi Iwashita, Senxi Li, Takeshi Fukaya
    International Symposium on Computational Science at Scale (CoSaS 2018) 2018年09月 ポスター発表
  • HACApK: Library for hierarchical matrices with adaptive cross approximation  [通常講演]
    Akihiro Ida, Takeshi Iwashita
    The 3rd International Workshops on Advances in Computational Mechanics (IWACOM-III) 2015年10月
  • H-matrices with ACA for Large-scale Simulation using Integral Equation Method  [招待講演]
    Akihiro Ida, Takeshi Iwashita
    ESPA2015 2015年09月
  • 領域分割および時間分割に基づく大規模並列磁界解析  [通常講演]
    高橋康人, 藤原耕二, 岩下武史, 中島浩
    平成27年電気学会全国大会, 5-S5-4 2015年03月
  • スライドメッシュを考慮した領域分割型並列有限要素法による回転機の磁界解析  [通常講演]
    高橋康人, 藤原耕二, 岩下武史, 中島浩
    電気学会静止器・回転機合同研究会資料, SA-15-49/RM-15-41 2015年03月
  • 動的負荷分散による階層型行列計算の並列化  [通常講演]
    棟形克己, 平石拓, 伊田明弘, 岩下武史, 中島浩
    第148回情報処理学会HPC研究会 2015年03月
  • New fill-in strategy for fast ICCG solver using SIMD vectorization  [通常講演]
    Takeshi Iwashita
    International Workshop on Information Technology, Applied Mathematics and Science (IMS2015) 2015年03月
  • Numerical Libraries and Software Framework for Application Programs in the Post Peta Era  [通常講演]
    Takeshi Iwashita
    BDEC Barcelona 2015年01月
  • A Variable Preconditioning of Krylov Subspace Methods for Hierarchical Matrices with Adaptive Cross Approximation  [通常講演]
    Akihiro Ida, Takeshi Iwashita, Takeshi Mifune, Yasuhito Takahashi
    COMPUMAG2015 2015年
  • Parallel Finite Element Analysis of Rotating Machines Based on Domain Decomposition Considering Nonconforming Mesh Connection  [通常講演]
    Yasuhito Takahashi, Koji Fujiwara, Takeshi Iwashita, Hiroshi Nakashima
    COMPUMAG2015 2015年
  • Development of Software Infrastructure for Large-scale BEM Analyses  [通常講演]
    Akihiro Ida, Takeshi Iwashita
    International Symposium on Post Petascale System Software (ISP2S2) 2014年12月
  • 伊田明弘, 伊田明弘, 岩下武史, 岩下武史, 美舩健, 美舩健, 高橋康人, 高橋康人
    計算工学講演会論文集(CD-ROM) 2014年06月
  • Parallel TP-EEC Method Based on Phase Conversion for Time-Periodic Nonlinear Magnetic Field Problems  [通常講演]
    Yasuhito Takahashi, Tadashi Tokumasu, Koji Fujiwara, Takeshi Iwashita, Hiroshi Nakashima
    The 16th Biennial IEEE Conference on Electromagnetic Fields Computation (IEEE-CEFC2014) 2014年05月
  • Analysis of Induced Electric Field in Human Body by ELF Magnetic Field Using Parallel FMM Accelerated BEM  [通常講演]
    Yasuhito Takahashi, Akira Ahagon, Koji Fujiwara, Takeshi Iwashita, Hiroshi Nakashima
    The 9th International Conference on Computation in Electromagnetics (CEM2014) 2014年03月
  • Parallel H-Matrices with Adaptive Cross Approximation for Large-Scale Simulation abstract updated  [通常講演]
    Akihiro Ida, Takeshi Iwashita
    SIAM Conference on Parallel Processing and Scientific Computing (SIAM PP14) 2014年02月
  • 清水康平, 美舩健, 岩下武史, 松尾哲司
    電気学会静止器研究会資料 2013年09月
  • 仙波和樹, たに浩司, 山田隆, 岩下武史, 高橋康人, 中島浩
    電気学会静止器研究会資料 2013年09月
  • 伊田明弘, 岩下武史, 美舩健, 高橋康人
    計算工学講演会論文集(CD-ROM) 2013年06月
  • 野瀬田裕樹, 河合直聡, 伊田明弘, 岩下武史, 中島浩, 美舩健, 高橋康人
    情報処理学会研究報告(CD-ROM) 2013年04月
  • 美舩健, 上畠哲志, 岩下武史, 松尾哲司
    電気学会静止器研究会資料 2012年09月
  • 岡本吉史, 高橋康人, 藤原耕二, 阿波根明, 美舩健, 岩下武史
    電気学会静止器研究会資料 2012年09月
  • 高橋 康人, 徳増 正, 藤田 真史, 岩下 武史, 若尾 真治, 藤原 耕二, 石原 好之
    電気学会研究会資料. SA, 静止器研究会 2012年01月
  • 美舩 健, 難波 亮介, 岩下 武史, 松尾 哲司
    電気学会研究会資料. SA, 静止器研究会 2011年08月
  • 北尾 純士, 高橋 康人, 藤原 耕二, 石原 好之, 美舩 健, 岩下 武史
    電気学会研究会資料. SA, 静止器研究会 2011年08月
  • 中島 研吾, 佐藤 正樹, 古村 孝志, 奥田 洋司, 岩下 武史, 阪口 秀
    情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2011年07月 
    ヘテロジニアスなアーキテクチャによる計算ノードを有するポストペタスケールシステムの処理能力を充分に引き出す科学技術アプリケーションの効率的な開発,安定な実行に資する 「自動チューニング機構を有するアプリケーション開発・実行環境:ppOpen-HPC」 を開発する.対象離散化手法を有限要素法,差分法,有限体積法,境界要素法,個別要素法に限定し,各手法の特性に基づきハードウェアに依存しない共通インタフェースを有するアプリケーション開発用ライブラリ群,耐故障機能を含む実行環境を提供する.自動チューニング技術の導入により,様々な環境下における最適化ライブラリ,耐故障機能を持つ最適化アプリケーションの自動生成を目指す.本研究は 2014 年度に東京大学情報基盤センターに導入予定の数十ペタフロップス級システムをターゲットとし,同システム上で実アプリケーションによって検証,改良し,一般に公開する.
  • 安部 達也, 平石 拓, 三宅 洋平, 岩下 武史, 中島 浩
    情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2011年07月 
    分散制約充足問題を分散並列計算環境で解くにあたり,ジョブを処理の単位とする分散並列処理 (ジョブ並列) に特化したジョブ並列スクリプト言語 Xcrypt で処理を記述することにより,実際の分散並列計算環境であるところの,いわゆるスーパーコンピュータを利用する方法を紹介する.さらに,Xcrypt の遠隔ジョブ投入機構を利用することにより,制約が遠隔の計算機に分散された状態からの制約充足問題,つまり,真の意味での分散制約充足問題を簡便に取り扱うことができることを示す.
  • 南 武志, 岩下 武史, 中島 浩
    情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2011年07月 
    本論文では高周波電磁場解析の一手法である 3 次元 FDTD 法におけるキャッシュメモリを考慮した性能改善手法の提案と性能評価を行う.3 次元 FDTD 法の計算カーネルは時間発展に関するループにより与えられ,各タイムステップにおいて電場と磁場の値が交互に更新される.3 次元 FDTD 法の計算カーネルは演算あたりのロード/ストア量が大きく,一般にメモリ帯域の影響を受けやすい計算である.キャッシュメモリのヒット率を向上しメインメモリへのアクセスによる性能の低下を軽減する性能改善手法として,解析領域をタイルと呼ぶ小領域に分割し各タイル内で複数のタイムステップに関する処理を連続して行うタイリングと呼ばれる手法が存在する.しかし,単純な固定タイルによる実装では,タイル間での冗長な計算がオーバーヘッドとなっていた.そこで,本論文ではタイリング手法において,タイルの位置と形状を時間ステップごとに変化させ計算量の増加を防ぐ手法を提案する.提案手法を評価した結果,AMD 製クアッドコア Opteron プロセッサよる数値実験において 4 スレッドによる並列処理を行った場合,一般的な 3 次元 FDTD 法の実装と比較して計算時間を約 50% 短縮させることに成功した.
  • 南 武志, 岩下 武史, 高橋 康人, 中島 浩
    情報処理学会研究報告. [ハイパフォーマンスコンピューティング] 2010年02月 
    本論文では,高周波電磁場解析の一手法である FDTD 法におけるキャッシュメモリを考慮した性能改善手法に関して述べる.FDTD 法の計算カーネルは時間発展に関するループにより与えられ,各タイムステップにおいて電場と磁場の値が交互に更新される.FDTD カーネルは演算あたりのロード/ストア量が大きく,一般にメモリ帯域の影響を受けやすい計算である.そこで,本論文では解析領域を小領域に分割し,これらの小領域での電磁場計算を複数タイムステップ分まとめて計算することにより,キャッシュメモリを有効活用し,FDTD カーネルを高速に実行する方法を提案する.その結果,4 コアの AMD Opteron プロセッサによる数値実験において,各コアで FDTD カーネルを並行に実行した場合,通常の FDTD 法の実装と比較して,約 3 割の速度向上を得た.
  • 松尾 哲司, 山崎 由也, 岩下 武史
    電気学会研究会資料. MAG, マグネティックス研究会 2010年01月
  • 岩下 武史, 島崎 眞昭
    情報処理学会論文誌 2002年04月 
    不完全コレスキー分解前処理付き共役勾配法(ICCG法)の代表的な並列化手法の1つとして,並列オーダリングの利用がある.これまでにも様々な並列オーダリングが提案されており,たとえば高い収束性と並列度を同時に実現する優れたオーダリングとして,大きな色数による多色順序付けがある.本論文では,収束性,並列度に加えて,並列化されたアルゴリズム中の同期点について考慮し,各代入計算の並列実行における同期点の数を1つにし,かつ前述の手法と同程度の高い収束性が得られる並列オーダリングとして,ブロック化赤一黒順序付けを新たに提案する.本手法は,節点のいくつかをブロック化し,そのブロックに対して赤一黒順序付けを適用するものである.各プロセッサがいくつかのブロックを担当することにより,代入計算が並列実行される.本手法の収束性,並列度,速度向上に関して,オーダリンググラフによる解析的検討,スカラ並列計算機上での数値解析的検討を行う.解析的検討では,ブロックサイズを増加させることにより収束性が改善されることを示し,実行計算機の並列度に合わせた最適なブロックサイズを導く.数値解析的検討では,提案手法がスカラ並列計算機上でめ実装において高い収束性とキャッシュデータの再利用性を持ち,約100万自由度を持つ差分解析の計算例において逐次型ICCG法と比べて16CPUで14.3倍の速度向上を得ることを示す.
  • 沢田 篤史, 岩下 武史, 神原 弘之
    情報処理学会研究報告. ソフトウェア工学研究会報告 2001年11月 
    本研究では, ハードウェア/ソフトウェア協調設計に用いられるリターゲッタブルコンパイラやシミュレータなどのソフトウェアツールを統合し, 設計対象システムの動作テストを行う環境を構築し, Web上に展開することを目指している.このように, 複数の開発者が遠隔から動作の確認や機能の検証を行える協調設計環境を整えることで, より信頼性や保守性の高い組込みシステムの開発が可能となると考えられる.
  • 美船 健, 岩下 武史, 島崎 眞昭
    計算工学講演会論文集 2001年05月
  • 岩下 武史, 島崎 眞昭
    情報処理学会研究報告. 計算機アーキテクチャ研究会報告 2001年03月 
    ICCG法の並列化手法の一つである多色順序付けに関して、構造型の差分格子を対象とした場合と非構造メッシュを対象とした場合の各々に関して報告する。構造型の差分格子を対象とした場合では、従来の大きな色数を用いた場合に問題となる代入計算中の同期点を削減する方法として、ブロック化による手法を提案する。ブロック化を進めることにより色数を最小値である2色にまで下げ、同期点を最小にしたブロック化赤-黒順序付けを提案し、同手法においてICCG法の収束性を保ちながら実行環境に合わせた並列度が得られることを示す。次に、非構造メッシュを対象とした有限要素解析において、多色順序付けを係数行列ベースで適用するための代数学的多色順序付けの一手法を提案し、並列電磁界辺要素有限要素解析において良好な結果が得られること示す。
  • 岩下 武史, 桐越 祐, 島崎 眞昭
    電気学会研究会資料. SA, 静止器研究会 2000年08月
  • 岩下 武史, 曽我部 亮, 島崎 眞昭
    電気学会研究会資料. RM, 回転機研究会 1999年08月
  • 岩下 武史, 松尾 哲司, 石川 本雄, 卯本 重郎
    電気学会研究会資料. ESC, 新・省エネルギー研究会 1995年09月

所属学協会

  • 情報処理学会   日本AEM学会   The Institute of Electrical and Electronics Engineers   電気学会   応用物理学会   日本応用数理学会   SIAM   

Works(作品等)

  • 高周波電磁界解析用連立一次方程式解法の並列処理による高速化 民間等共同研究: 株式会社 村田製作所
    2005年
  • 分散メモリ環境における前処理を含む並列版反復型マトリクスソルバの開発 民間等共同研究: 株式会社 ヴァイナス
    2005年
  • 高周波電磁界解析用連立一次方程式解法の高速化について (民間等共同研究: 株式会社 村田製作所)
    2004年

共同研究・競争的資金等の研究課題

  • 日本学術振興会:科学研究費助成事業 基盤研究(S)
    研究期間 : 2019年06月 -2024年03月 
    代表者 : 中島 研吾, 下川辺 隆史, 岩下 武史, 片桐 孝洋, 松葉 浩也, 八代 尚, 荻田 武史, 長尾 大道
  • 日本学術振興会:科学研究費助成事業 挑戦的研究(萌芽)
    研究期間 : 2020年07月 -2023年03月 
    代表者 : 岩下 武史, 深谷 猛
  • ポストムーア時代を支える100ギガヘルツ級時空間超伝導コンピューティング
    日本学術振興会:科学研究費助成事業 基盤研究(A)
    研究期間 : 2019年04月 -2022年03月 
    代表者 : 井上 弘士, 松永 裕介, 田中 雅光, 岩下 武史, 谷本 輝夫, 小野 貴継
  • 日本学術振興会:科学研究費助成事業 基盤研究(B)
    研究期間 : 2019年04月 -2022年03月 
    代表者 : 岩下 武史, 塙 敏博, 伊田 明弘, 美舩 健, 高橋 康人, 深谷 猛
     
    ① 非定常,非線形電磁場解析における反復法の収束性改善に関する研究に取り組んでいる.本研究では,同一または類似の係数行列を有する連立一次方程式の求解において,過去の求解過程から取得した情報を用いる手法について研究している.2019年度において,本手法を電磁場有限要素解析を含む多様な応用において簡便に利用可能とする実装方式を考案した.考案した実装方式に基づき,C言語を利用して,過去の求解情報を利用する線形ソルバのプロトタイプ実装を行った.② 階層型行列・ベクトル積の高速化のために,混合精度演算の導入を行う手法を考案し,性能評価を行った.階層型行列の葉行列の一部を単精度化する方法や葉行列のデータ構造を変化させ,さらに葉行列内において混合精度を用いる方法を提案し,境界要素電磁場解析上でその性能を評価した.本研究の成果について,国際会議論文として発表を行った.③ ICCG法(不完全コレスキー分解前処理付き共役勾配法)の高性能なマルチスレッド並列処理のために,高い収束性とSIMDベクトル処理の両方を実現する手法を新たに考案した.本手法では,収束性と並列性の両面に優れるブロック多色順序付け法において,同手法の長所を維持しながら,再順序付けによってSIMDベクトル演算の導入を可能とする.④ 電気機器の解析に用いられる多相周期境界条件を有する有限要素電磁場解析において時間方向並列処理を行う手法を提案し,その性能を評価した.本成果について,国際学術論文誌において報告した.
  • SIMDベクトル演算活用のための規則化技術の研究
    文部科学省:科学研究費補助金(基盤研究(B))
    研究期間 : 2018年04月 -2021年03月 
    代表者 : 中島 浩
  • H行列法ライブラリの機能拡張と次世代スパコン向け最適化
    文部科学省:科学研究費補助金(基盤研究(B))
    研究期間 : 2017年04月 -2020年03月 
    代表者 : 伊田 明弘
  • 自動チューニング機構を有するアプリケーション開発・実行環境
    JST:CREST
    研究期間 : 2010年10月 -2016年03月 
    代表者 : 中島 研吾
  • 文部科学省:科学研究費補助金(基盤研究(B))
    研究期間 : 2014年 -2016年 
    代表者 : 岩下 武史
  • 文部科学省:科学研究費補助金(挑戦的萌芽研究)
    研究期間 : 2014年 -2015年 
    代表者 : 岩下 武史
  • 文部科学省:科学研究費補助金(基盤研究(B))
    研究期間 : 2012年 -2014年 
    代表者 : 片桐 孝洋, 田中 輝雄, 黒田 久泰, 岩下 武史, 佐藤 雅彦, 大島 聡史
     
    疎行列反復解法ライブラリにおいて、エクサスケール環境に適用できる実行時自動チューニング(AT)技術の方式開発を、以下のグループごとに研究を進めた。<AT方式開発グループ>では、疎行列反復解法ライブラリXabclibのMPI並列化のための基本設計を行った。疎行列の格納形式をAT手法により疎行列ベクトル積(SpMV)の効率化を行い、格納形式を自動選択するアルゴリズムを実装した。部分行列での最適な格納形式の推測性能を実験し、行方向で作るか列方向で作るかにより格納効率に差が出ることを明らかにした。この結果を基に、格納形式をATするアルゴリズムを実装し、反復法を用いたSpMV演算で他手法との比較を行った。また、AT用のフィッティング関数d-Splineを、情報量基準ABICを用いて2相問題および制約つき問題へ拡張した。<数値計算ライブラリ適用グループ>では、GPU向けのSpMV実装を継続するとともに、メニーコアプロセッサなど他のアーキテクチャとの性能比較も実施した。特にCRS形式のSpMVについて、多くの性能評価を行った。東大のスパコンを用いて、大規模なSpMVを行うライブラリ開発を行い、かつ性能評価を行った。また、Xabclibをオープンソースの数値流体力学コードOpenFOAMのソルバ部に適用し、ATの有効性を評価した。<アプリケーション適用グループ>では、有限要素解析や差分解析で広く用いられているICCG法について、メニーコアプロセッサやマルチコアプロセッサが有するSIMD演算を有効活用する実装手法について研究を行った。係数行列をブロック化し、不完全コレスキー分解においてブロック内のフィルインを許可するICCG(B)法を考案した。また、陰的時間積分法を用いた3次元線形MHDコードの開発を進めた。128×64×128のメッシュを用いて、ヘリカルプラズマ中での線形MHD不安定性の線形成長率および固有関数を評価し、陽的時間積分法コードで得られる計算結果との比較を行った。
  • 文部科学省:科学研究費補助金(基盤研究(B))
    研究期間 : 2011年 -2013年 
    代表者 : 中島 浩, 岩下 武史, 平石 拓, 大村 善治, 村田 澄彦
     
    本研究で提案した時空間タイリングは、シミュレーションコードの基本構造である時間・空間の多重ループに対し、広大な空間の走査ループをキャッシュメモリに適合可能な小空間(タイル)単位の走査に分割し、かつ空間タイルの時間的更新過程を複数ステップにわたって繰り返すことで、メモリ参照局所性を改善して高速化する技術である。本研究では、局所視点に基づくコード断片記述による時空間タイリング適用を自動化する枠組の開発と、FDTD法電磁場解析、PIC法プラズマシミュレーション、マルチグリッド法ポアソン求解の各応用に対する時空間タイリングの適用実験を行い、各々について目標とした2倍程度の高速化を達成した。
  • 文部科学省:科学研究費補助金(基盤研究(B))
    研究期間 : 2009年 -2011年 
    代表者 : 片桐 孝洋, 今村 俊幸, 須田 礼仁, 伊藤 祥司, 岩下 武史, 滝沢 寛之, 黒田 久泰
     
    本研究では、多様な計算機環境において高性能を達成するため、自動チューニング(AT)を実現する以下の研究開発を行った。(1)マルチコア・超並列環境に適用できるAT言語ABCLibScriptの機能拡張;(2)マルチコアCPUおよびGPUでのAT効果の検証;(3)いくつかのアプリケーションソフトウェアに新規ABCLibScript機能を適用し有効性を検証;(4)新規ABCLibScript処理系を、フリーソフトウェアとしてインターネット上に公開。
  • 文部科学省:科学研究費補助金(若手研究(A))
    研究期間 : 2009年 -2011年 
    代表者 : 岩下 武史
     
    ペタスケールシミュレーションに向けた線形ソルバのために、大規模問題を含む悪条件問題に対する対応技術、高い並列性能を実現する並列化技術に関する研究を行った。悪条件問題に対する処置として、陰的マルチグリッド法やEEC/IEC法と呼ばれる誤差修正法を活用し、多様なマルチグリッドソルバを簡便に構築する技術の開発や具体的な応用分野(計算電磁気学)における収束性の改善法を提案した。また、開発した並列化線形ソルバの性能評価試験として、大規模高周波電磁場解析において生ずる8億自由度の問題を1024コアにより250秒以内で求解することに成功した。
  • 文部科学省:科学研究費補助金(基盤研究(B))
    研究期間 : 2008年 -2010年 
    代表者 : 中島 浩, 岩下 武史, 平石 拓
     
    並列計算は大規模シミュレーションに不可欠な手段であるが、30年以上にわたる研究開発にも関わらず、並列プログラミングの生産性は依然として低い水準にとどまっている。本研究は生産性向上の鍵として、並列化の手法・技法をライブラリとして提供すると同時に、ライブラリを応用プログラムに適合する形で構築する技術の確立を目的として実施した。その結果、粒子シミュレーションのための負荷分散技法OhHelp、疎行列係数線型方程式のICCG法・マルチグリッド法によるソルバーなどのライブラリ化を、さまざまな応用に適用可能な形で実現した。
  • 文部科学省:科学研究費補助金(基盤研究(C))
    研究期間 : 2007年 -2009年 
    代表者 : 松尾 哲司, 岩下 武史, 美舩 健
     
    電磁鋼板の磁気特性表現のために,高精度な等方性および異方性ベクトルヒステリシスモデルを開発した。その手法および積層鉄芯の均質化手法を用いた効率的な電磁界解析手法を開発した。磁区構造モデルを改良し,中間スケールの磁化過程の記述を可能にした。周期境界条件を仮定したマイクロ磁気学シミュレーション手法を開発した。
  • 文部科学省:科学研究費補助金(若手研究(B))
    研究期間 : 2006年 -2008年 
    代表者 : 岩下 武史
     
    最も一般的に使用されている線形反復法であるICCG法において収束性を簡便に評価する方法を確立し、実応用分野での数値解析においてその評価を行った。また、大規模シミュレーションでは不可欠な線形反復法であるマルチグリッド法において、簡便に数多くのスムーザや最粗グリッドにおける解法を評価し、それらの選択を容易にする陰的マルチグリッド法とよぶ新種の方法を考案した。同手法は平成19年情報処理学会山下記念研究賞を受賞している。
  • 文部科学省:科学研究費補助金(基盤研究(C))
    研究期間 : 2005年 -2006年 
    代表者 : 島崎 眞昭, 松尾 哲司, 岩下 武史, 美舩 健
     
    1.モルタル有限要素解析のための反復解法に関する検討モルタル有限要素法の定式化には、Lagrangeの未定乗数法と呼ばれる方法と、領域境界上のスレーブ側未知数を消去する方法の2つがある。両者に関して、クリロフ部分空間法による求解について検討を行った。クリロフ部分空間法の性能は前処理手法に大きく依存するが、最小残差法、共役勾配法のそれぞれについて不完全コレスキー分解をベースとした様々な前処理手法を提案した。スレーブ側未知数を消去する方法を用い、近似係数行列に不完全コレスキー分解を施すことで前処理を構成する手法が計算時間の面から有望であることを示した。2.代数マルチグリッド法を用いたモルタル有限要素解析モルタル有限要素解析への応用の準備段階として、電磁界解析で実用的に重要とされる辺要素及び節点要素を用いた解析において優れた収束性を得る代数マルチグリッド前処理付反復解法を提案した。モルタル有限要素解析において境界上のスレーブ側未知数を消去する方法を扱い、代数マルチグリッド法を共役勾配法の前処理として効率的に適用する手法を提案した。数値例として永久磁石モータを対象とした解析をとりあげ、不完全コレスキー分解をベースとした前処理と比較して大幅な高速化が行われることを示した。また、半周期毎にポテンシャルの符号が反転する境界条件についても問題なく扱うことが出来ることも示した。3.非線形磁界解析の代数マルチグリッド法による高速化磁気スカラポテンシャルを未知数とした非線形静磁界解析を行い、共役勾配法の前処理として代数マルチグリッド法を用いることで、不完全コレスキー分解前処理を使用する場合と比較して解析を大幅に高速化することができた。共役勾配法の収束判定基準を緩やかにしたとき、ニュートン・ラフソン法の収束に与える影響は小さく、解析全体を高速化出来ることを示した。
  • 文部科学省:科学研究費補助金(若手研究(B))
    研究期間 : 2004年 -2005年 
    代表者 : 岩下 武史
     
    本研究では、代数マルチグリッド法(AMG法)と並列処理技術を用いることにより高速な連立一次方程式の求解法を確立することを目的とし、以下のような研究を行った。1 AMG法の並列化において特に困難があるスムーザ部の並列処理を代数的マルチカラーオーダリング法により実現し、有限要素解析による実アプリケーション上でその性能を確認した。本研究成果はIEEE Transaction on Magneticsに論文発表されている。2 AMG法におけるロバストなスムーザとして注目されるILU分解スムーザの並列処理について検討を行い、適切なスムーザの並列処理手法の選択を可能にする評価指標の確立を行った。本指標を差分解析および有限要素解析による実アプリケーション上で評価し、良好な結果を得た。本研究成果はSIAMJournal on Scientific Computing及び情報処理学会論文誌に論文発表されている。3 京都大学内の2つのキャンパス(吉田キャンパス、桂キャンパス)にまたがる計算グリッドを構築し、計算グリッド上で有効なAMG法について検討を行った。上記の2つのキャンパスは約15キロ離れており、吉田キャンパス設置のスーパーコンピュータ及びPCと桂キャンパス設置のPCをグリッドミドルウェアGlobus2.4により連携した。AMG法を用いた有限要素解析プログラムを上記の環境で実行し、計算グリッドのような通信性能が低い並列処理環境ではより簡便なスムーザを用いるほうが有効性が高いことが分かった。
  • 文部科学省:科学研究費補助金(基盤研究(C))
    研究期間 : 2002年 -2003年 
    代表者 : 島崎 眞昭, 岩下 武史, 松尾 哲司, 美舩 健
     
    近年,省エネルギー・環境問題への対応のため,鉄損を正確に評価した解析や振動・騒音を考慮した構造・電磁気連成解析などの高度な電磁界解析が必要とされ、その結果,解析に多大な計算量が要求されることから,解析の高速化が重要な課題となっている。他方,高性能計算の分野ではPCクラスタの利用技術が進展しているが,電磁界解析分野では,対象物の構造の複雑性やゲージ問題などの種々の問題があることから,PCクラスタなどの並列計算環境の活用は立ち後れているのが現状である。そこで本研究では,並列計算環境における,(1)高速な電磁界解析アルゴリズムの開発,(2)鉄損を正確に評価した高度な最適設計計算法,の開発を目的として研究を行い、以下の成果を得た。(1-a)連立一次方程式の高速解法として期待されるマルチグリッド法の中で,汎用性と簡便性に優れた代数マルチグリッド(AMG)法に着目し,AMG法の適用範囲を実対称H行列を係数行列とする連立一次方程式にまで拡大するとともに,電磁界解析の主流の解法である辺要素有限要素法に対するAMG法の適用手法の開発に成功した。(1-b)連立一次方程式の代表的な解法であるICCG法の並列化手法として,ブロック化赤-黒順序付け法を開発し,高い並列化効率と汎用性を持つ解法を実現した。(2-a)分散計算環境下での遺伝アルゴリズム(GA)の研究を行い,有限要素法を用いた電気機器の最適形状設計問題について,島モデルGAが効果的であることを示した。(2-b)電磁界解析に適した磁気ヒステリシス特性の表現法の研究を行い、ストップモデルとプレイモデルを用いた,電磁鋼板の直流ヒステリシス特性の簡潔で正確なモデル化手法を開発するとともに,渦電流解析との併用により交流ヒステリシス特性を表現する手法を開発した。さらに,非整合格子を許容する有限要素法の回転機解析への応用を行った。
  • Paralell processing of electromagnetic field analysis


Copyright © MEDIA FUSION Co.,Ltd. All rights reserved.