2024年7月11日木曜日

Catch Key Points of a Paper ~0067~

論文のタイトル: A Machine Learning Approach to Model Interaction Effects: Development and Application to Alcohol Deoxyfluorination

著者: Andrzej M. Żurański, Shivaani S. Gandhi, and Abigail G. Doyle

雑誌: Journal of the American Chemical Society

巻: 145, 7898−7909

出版年: 2023年


背景

1: 機械学習と高スループット実験

機械学習(ML)技術の高スループット実験(HTE)データセットへの応用が増加

HTEデータセットは多数の反応成分を系統的に変化させて生成

反応成分間の相互作用効果のモデル化が課題

既存のMLアルゴリズムでは相互作用効果の学習が困難


2: 相互作用効果モデル化の課題

無関係な特徴の存在が相互作用効果の学習を妨げる

HTEデータセットの実験設計と構造を考慮できないMLモデル

広範な分子特徴量使用による無関係な特徴の混入

相互作用効果の学習に特化したアプローチの必要性


3: 新しいモデリングアプローチの提案

HTEデータセットの統計的モデリングアプローチの開発

実験の分散分析(ANOVA)による系統的効果の特定

個々の効果を化学情報に基づく特徴量で回帰

アルコールの脱酸素フッ素化データセットへの適用と検証


方法

1: 統計的モデリングワークフロー

ANOVAによるHTEデータセットの分析

反応収率に有意な影響を与える成分の特定

一般化加法モデル(GAM)の構築

化学的特徴量を用いた個々の効果のモデル化


2: アルコール脱酸素フッ素化データセット

37種類のアルコール(第1級、第2級、ベンジル、環状)

5種類のスルホニルフルオリド

4種類の塩基(アミジン/グアニジン/ホスファゼン)

全740反応の全因子実験計画


3: 計算化学的アプローチによる特徴量生成

M06-2X/def2-TZVP レベルのDFT計算

THF溶媒効果の考慮

アルコールの立体的・電子的特徴量の計算

AutoQChemワークフローによる特徴量生成の自動化


4: 交差検証と外部検証によるモデル評価

Leave-One-Alcohol-Out (LOAO) 交差検証

平均絶対誤差(MAE)とRoot Mean Squared Error (RMSE)の算出

新規アルコール化合物セットによる外部検証

ランダムフォレストモデルとの性能比較


結果

1: ANOVAの主効果と相互作用効果

すべての主効果(アルコール、塩基、スルホニルフルオリド)が有意

アルコール-塩基、アルコール-スルホニルフルオリドの相互作用が有意

塩基-スルホニルフルオリドの相互作用は有意性が低い

モデルM0との調整済みR2 = 0.97、残差標準誤差 = 3.9%


2: アルコール-塩基相互作用における立体効果と反応性の関係

α炭素の埋没体積(Vbur)が相互作用の指標

Vbur < 0.37のアルコールで塩基依存性が大きい

第1級、非嵩高アルコールでDBUの性能が低下

ベンジルアルコールではDBUとMTBDで収率低下


3: アルコール-スルホニルフルオリド相互作用における環状アルコールの特異性

α炭素の結合角(α)が相互作用の指標

α < 101.8°の歪んだ環状アルコールで相互作用が顕著

パーフルオロ-1-ブタンスルホニルフルオリド(PBSF)が環状アルコールに対して高い収率

5員環アルコールでも同様の傾向が観察されるが、効果は小さい


考察

1: モデルの性能と予測精度の向上

新モデルM1: MAE = 13%, RMSE = 17%

旧ランダムフォレストモデル: MAE = 18%, RMSE = 21%

M1モデルは過学習が少なく、汎化性能が向上

第3級アルコールと不飽和アルコールの予測精度に課題


2: 競争的求核置換反応におけるアルコール-塩基相互作用の解釈

立体障害の少ない第1級/ベンジルアルコールでDBU, MTBDの性能低下

DBUによる求核置換反応が競合的に進行

m-クロロベンジルアルコールとDBUの反応でアミジニウム塩を55%収率で単離

塩基サイズと求核性が相互作用の原因と推測


3: アルコール-スルホニルフルオリド相互作用の解釈

タイトル: 環状アルコールの立体化学と反応性

環状アルコールの立体化学的研究でSN2機構を支持

速度論的研究でフッ化物イオン濃度への正の依存性を確認

PBSFはより強力な求電子剤を生成し、SN2反応を促進

PBSF-BTMG付加体が追加のフッ化物源として機能する可能性


4: モデルの限界

第3級アルコール、アリルアルコールの予測精度向上が必要

データセットの拡張による不活性基質クラスのモデル安定化



結論

HTEデータセットの相互作用効果を効果的にモデル化

ANOVAと特徴量ベースの回帰を組み合わせた新手法を開発

アルコール脱酸素フッ素化反応の理解を深化

予測精度の向上と化学的解釈可能性の両立を実現

機械学習と化学的専門知識の融合による反応開発の新たな方向性を提示


将来の展望

収率以外の反応性指標(選択性、反応速度)の考慮

3成分以上の多重相互作用のモデル化手法の開発

0 件のコメント:

コメントを投稿