Takeshi Yoshimura (吉村剛)  Takeshi Yoshimura (吉村剛) photo         

contact information

IBM Research - Tokyo


Professional Associations

Professional Associations:  ACM  |  IEEE   |  IPSJ


I recieved my Ph.D from Keio University in Japan. My Ph.D. work was a study on bugs and error propagation in Linux kernel. The work leveraged natural language processing and machine learning to extract useful information from software repositories to verify device drivers.

In IBM, my work shifted to optimizations of data processing systems software: Apache Spark, MongoDB, NVMe/NVMM driver with SPDK/DPDK/PMDK, cuDF/cuML, and other data processing systems. I am also exploring the possibility of POWER systems for high performance data processing.


Technical Interests

  • Operating system, virtualization, Linux, Xen, KVM
  • Software engineering, software bugs, LLVM/Clang static analyzer
  • Parallel distributed computing, Spark, Hadoop, HDFS, Parquet
  • NoSQL, MongoDB, RocksDB
  • High performance storage/network software, SPDK, DPDK
  • User-level filesystems for non-volatile memory
  • Data engineering software using python and GPGPU like cuDF, cuML
  • Non-x86 systems, PowerPC

Publications (Google scholar)

  • EvFS: User-level, Event-Driven File System for Non-Volatile Memory. [paper, slides]
    Takeshi Yoshimura, Tatsuhiro Chiba, Hiroshi Horii
    11th USENIX Workshop on Hot Topics in Storage and File Systems (HotStorage '19), 2019
  • Column Cache: Buffer Cache for Columnar Storage on HDFS. [paper, slides]
    Takeshi Yoshimura, Tatsuhiro Chiba, Hiroshi Horii
    IEEE International Conference on Big Data (BigData '18), 2018
  • Towards Selecting Best Combination of SQL-on-Hadoop Systems and JVMs. [paper, slides]
    Tatsuhiro Chiba, Takeshi Yoshimura, Michihiro Horie, Hiroshi Horii
    IEEE International Conference on Cloud Computing (CLOUD 2018), 2018
  • A case for static analysis of linux to find faults in interrupt request handlers.
    Takeshi Yoshimura, Kenji Kono
    Transactions on Advanced Computing Systems (ACS53) 24 (3), 573-582, 2016
  • Starving for Hints!: Toward Predicting Resource Usage Levels of Tasks in a Distributed Computing Framework Layer.
    Masato Asahara, Takeshi Yoshimura
    6th Asia-Pacific Workshop on Systems (APSys '15), Poster, 2015
  • Improving File System Test Coverage with Injected Disk Snapshot
    Naohiro Aota, Takeshi Yoshimura, and Kenji Kono
    13th USENIX Conference on File and Storage Technologies (FAST '15), Work-in-Progress, 2015.
  • FoxyFeed: Forging Device-Level Asynchronous Events for Kernel Development.
    Kenji Kono, Shunsuke Miyahara, Hiroshi Yamada, Takeshi Yoshimura
    20th Pacific Rim International Symposium on Dependable Computing (PRDC '14), 2014
  • Do injected faults cause real failures? a case study of linux.
    Nobuo Kikuchi, Takeshi Yoshimura, Ryo Sakuma, Kenji Kono
    25th International Symposium on Software Reliability Engineering (ISSRE '14), Student paper, 2014
  • Who Writes What Checkers? - Learning from Bug Repositories. [paper, slides]
    Takeshi Yoshimura, Kenji Kono
    10th Workshop on Hot Topics in System Dependability (HotDep '14), 2014
  • Using fault injection to analyze the scope of error propagation in linux.
    Takeshi Yoshimura, Hiroshi Yamada, Kenji Kono
    Transactions on Advanced Computing Systems (ACS42) 8 (3), 655-664, 2013
  • Is linux kernel oops useful or not? [paper, slides]
    Takeshi Yoshimura, Hiroshi Yamada, Kenji Kono
    8th Workshop on Hot Topics in System Dependability (HotDep '12), 2012
  • Can Linux be rejuvenated without reboots?
    Takeshi Yoshimura, Hiroshi Yamada, Kenji Kono
    3rd International Workshop on Software Aging and Rejuvenation (WoSAR '11), 2011

Open source contributions



  • 不揮発性メモリ利用を最適化するユーザレベルファイルシステム
    吉村剛, 千葉立寛, 堀井洋
    研究報告ハイパフォーマンスコンピューティング (HPC) 2019 (7), 1-8
  • POWERシステムへのユーザレベルNVMeドライバの移植と性能評価
    吉村剛, 千葉立寛, 堀井洋
    研究報告システムソフトウェアとオペレーティング・システム(OS) 2018 (11), 1-8
  • SQL on Hadoop における実行エンジン及びJVMの適応的選択を用いたクエリの高速化に向けて
    千葉立寛, 吉村剛, 堀江倫大, 堀井洋
    研究会報告システムソフトウェアとオペレーティング・システム(OS) 2017 (18), 1-18
  • バッファキャッシュを用いた Spark シャッフル処理の最適化に向けて
    吉村剛, 千葉立寛, 堀井洋, 小野寺民也
    コンピュータシステム・シンポジウム論文集 2016, 1-8
  • ログの自動挿入によるスレッド間のデータ依存関係の追跡
    窪田貴文, 吉村剛, 河野健二
    研究報告システムソフトウェアとオペレーティング・システム (OS) 2016 (11), 1-10
  • パフォーマンス障害に対する管理図によるログ削減手法
    中村啓太郎, 深井賢, 吉村剛, 河野健二
    研究報告システムソフトウェアとオペレーティング・システム (OS) 2015 (16), 1-7
  • 実行パスの解析による性能障害の原因関数の推定
    深井賢, 中村啓太郎, 吉村剛, 河野健二
    研究報告システムソフトウェアとオペレーティング・システム (OS) 2015 (16), 1-7
  • ReBucket を用いた Linux クラッシュログの分類と分析
    佐久間亮, 吉村剛, 河野健二
    研究報告組込みシステム (EMB) 2015 (16), 1-8
  • ファイルシステムテストツールのカバレッジ調査
    青田直大, 吉村剛, 河野健二
    研究報告システムソフトウェアとオペレーティング・システム (OS) 2014 (6), 1-6
  • Linux へのソフトウェアフォールトインジェクションの有用性の調査
    菊池伸郎, 吉村剛, 佐久間亮, 河野健二
    研究報告システムソフトウェアとオペレーティング・システム (OS) 2014 (15), 1-7
  • ReBucket を用いた Linux カーネルバグの分類
    佐久間亮, 菊池伸郎, 吉村剛, 河野健二
    研究報告システムソフトウェアとオペレーティング・システム (OS) 2014 (11), 1-9
  • Linux における障害異常検知への管理図の適用
    深井賢, 中村啓太郎, 吉村剛, 河野健二
    研究報告システムソフトウェアとオペレーティング・システム (OS) 2014 (14), 1-7
  • Linux カーネルにおけるバグの実態調査
    吉村剛, 河野健二
    研究報告システムソフトウェアとオペレーティング・システム (OS) 2014 (10), 1-12
  • 仮想マシンモニタを用いた割込み処理のデバッグ手法
    宮原俊介, 吉村剛, 山田浩史, 河野健二
    研究報告システムソフトウェアとオペレーティング・システム (OS) 2013 (6), 1-8
  • Linux カーネルにおけるエラー伝播の調査
    吉村剛, 山田浩史, 河野健二
    研究報告システムソフトウェアと オペレーティング・システム (OS) 2012 (8), 1-10
  • オペレーティングシステムカーネルにおけるエラー伝播の調査
    吉村剛, 山田浩史, 吉田哲也, 河野健二
    研究報告システムソフトウェアと オペレーティング・システム (OS) 2011 (6), 1-8

国内研究会 PC 他

  • xSIG PC, 2018, 2019
  • ComSys PC, 2016, 2017, 2018
  • IPSJ Magazine Editorial Committee, 2019-