データ化学工学研究室(金子弘昌専任准教授主宰)から発表された論文が、国際学術雑誌 Journal of Chemical Information and Modeling における Volume 63, Issue 3 (2023) の表紙絵を飾りました。
分子設計・材料設計において、分子の化学構造から変換された分子記述子 x と分子・材料の物性・活性・特性といった目的変数 y との間で数理モデル y = f(x) を構築します。モデルを構築したら、新たな分子に対して、分子の化学構造から変換した x の値から y の値を予測したり、y の目標値を達成するための分子の化学構造を設計したりします。分子設計に必要なことは、y の目標値からそれを実現するための分子を導くことです。ただ一般的には、分子の化学構造をコンピュータで大量に生成し、それらを x に変換した後にモデルに入力して y の値を予測し、予測値が良好な分子を選択することに過ぎず、ある狭い範囲での分子探索しかできませんでした。そこで本研究では物性や活性の y が目標値を持つ分子を直接的に生成するため、Chemical Variational Auto-Encoder (VAE) と Gaussian Mixture Regression (GMR) を組み合わせた手法de novo direct inverse QSPR/QSAR を開発しました。これにより、y の目標値を入力することで、それを達成する分子を、まさに表紙絵のように化学空間の中から直接的に獲得することができるようになりました。