論文のタイトル: Integrated computational and experimental design of fluorescent heteroatom-functionalised maleimide derivatives(ヘテロ原子官能基化マレイミド誘導体の蛍光特性に関する統合的計算および実験的設計)
著者: Jake E. Barker, Gareth W. Richings, Yujie Xie, Julia Y. Rho, Calum T. J. Ferguson, Rachel K. O’Reilly, Scott Habershon
雑誌名: Chemical Science
巻: 2024
号: d4sc04816d
出版年: 2024
DOI: 10.1039/d4sc04816d
背景
1: 研究の背景
マレイミドは、光物理特性を持つ有機分子として、太陽電池、OLED、エレクトロクロミック材料、コーティング、加硫剤、免疫複合体、蛍光消光剤、バイオセンサーなど多くの応用がある
特に、近接して結合した分子内ドナーとアクセプター部分を持っているため、生物学的細胞の蛍光プローブとしての利用が注目されている
マレイミドの光物理特性は、溶媒や官能基によって大きく変化し、大きなストークスシフト(>100 nm)、高い量子収率、強いソルバトフルオロクロミズムを示す可能性がある
2: 未解決の問題点
既存の合成方法では、特定の光物理特性を持つマレイミドの設計が困難
特定の光物理的特性を持つ有機分子種の設計と合成は、計算化学と実験化学の両方にとって重要な課題
溶媒依存性の光物理特性を予測するための効率的な方法が求められている
3: 研究の目的
計算と実験を統合した方法で、特定の光物理特性を持つマレイミド誘導体を設計
AI/MLとab initio検証の両方を組み込んだ2つの計算戦略を開発し、新規性と調整可能性を求めて官能基化マレイミドの化学空間を探索
期待される成果として、新しい蛍光プローブの開発を目指す
方法
1: 研究デザイン
計算と実験を統合したアプローチを採用
計算方法: TD-DFT計算、人工ニューラルネットワーク(ANN)を使用
実験方法: マレイミド誘導体の合成と光物理特性の評価
2: データセットと人工ニューラルネットワーク(ANN)
文献から蛍光マレイミド誘導体に関する実験情報を収集し、機械学習トレーニングセットを作成
合計258のマレイミドの例を文献から手動でスクレイピングし、複数の溶媒中のさまざまなマレイミド誘導体を含めた
マレイミド構造、最大蛍光励起波長、発光(lem)、および対応する溶媒のすべてが明確に報告されている場合、実験データを機械学習データセットに組み込む
このデータセットを使用して、ANNをトレーニングし、分子構造と溶媒パラメータから発光波長(lem)などの光化学的特性を予測する単純なMLフレームワークを構築
3: ANNの詳細
マレイミド構造に関する情報をエンコードするために、拡張接続フィンガープリント(ECFP)*(Morganフィンガープリント)を構造記述子として使用
溶媒の記述には、誘電率を直接使用
すべてのANN計算において、ECFPの長さは1024ビット、部分構造(結合半径)の長さは5を使用
標準のフィードフォワードANNを採用し、分子構造とlemの関係を学習
各分子について、入力層は1024ビットのECFPベクトルと、対応する溶媒の誘電率を表す浮動小数点値で構成
出力層は、予測されたlemに対応する単一の値で構成
すべての計算において、250ノードで構成される単一の隠れ層を持つANN構成を使用
標準の修正ロジスティックユニット(ReLU)活性化関数を全体で使用
4: 実験及び検証条件
反応物: マレイミド誘導体、溶媒
室温、各種溶媒中での反応
主要評価項目: 吸収および発光波長
測定方法: UV/Vis分光法、蛍光分光法
データ解析: 計算結果と実験結果の比較
結果
1: 主要な結果
新規に合成したマレイミド誘導体の光物理特性を評価
TD-DFT計算(B3LYP/6-31G **)と比較して、ANNは計算コストが低い
溶媒の誘電率が吸収および発光波長に与える影響を確認
2: ANNの性能
トレーニングデータはランダムにトレーニング(90%)とテスト(10%)のセットに分割され、ANNは確率的勾配降下法を使用して最大2000回の反復でトレーニングされた
トレーニングセットのR2相関係数は通常0.96であることがわかりましたが、テストセットのR2値は通常約0.87
ECFP記述子を使用したANNのパフォーマンスレベルは、比較的小さなデータセットの場合、マレイミドの構造と溶媒から光物理特性を予測するのに有効
3: 溶媒効果の予測
ANNは、溶媒依存性の光物理特性を正確に予測
TD-DFT計算(B3LYP/6-31G **)は、高誘電率の溶媒での予測が困難
考察
1: 主要な発見
マレイミドの構造と溶媒の組み合わせが光物理特性に与える影響を詳細に解析
ANNの予測精度は、データセットの質に依存
2: ANNの利点
ANNは、溶媒の誘電率のみを入力として使用して、実験的な吸収波長をB3LYP/6-31G **の値よりもはるかに正確に溶媒依存性の光物理特性を予測するのに有効
TD-DFT計算(B3LYP/6-31G **)は、低誘電率の溶媒での予測に適している
3: 先行研究との比較
既存の方法と比較して、ANNは計算コストが低く、予測精度が高い
TD-DFT計算は、特定の条件下での予測に優れている
ANNとTD-DFT計算の組み合わせが、より正確な予測を可能にする
溶媒の影響を考慮した新しい設計手法として有望
4: 研究の限界
ANNの予測精度は、トレーニングデータの質に依存
TD-DFT計算は、計算コストが高く、溶媒の影響を完全に再現できない
結論
ANNとTD-DFT計算を統合した方法で、特定の光物理特性を持つマレイミド誘導体を効率的に設計
将来の展望
データセットの拡充と計算手法の改良
0 件のコメント:
コメントを投稿