msFineAnalysis AIを用いた酢酸ビニル樹脂中添加剤と類縁化合物の構造解析
MSTips No. 390
MSTips No. 390
はじめに
ライブラリーデータベース(DB)未登録の化合物の定性分析では、分子イオンやプロトン付加分子を与えやすいソフトなイオン化法と精密質量測定ができる飛行時間型質量分析計(TOFMS)の組み合わせが有用である。 電界イオン化(FI)法などのソフトイオン化法にて分子イオンを観測し、更に精密質量に対して組成推定を行うことでDB未登録の未知化合物であってもその分子式を決定できる。弊社ではEI法とソフトイオン化法で得た2つのマススペクトルを用いた定性解析手法を"統合解析"とし、これを搭載したソフトウェアmsFineAnalysisを2018年にリリースした。
TOFMSを用いた統合解析ではフラグメントイオンの組成式も得られるため、部分構造情報を得ることができる。また、部分構造情報と分子式情報を組み合わせることで化合物の構造解析が可能になる。しかし、最終的な構造推定については解析者自身による考察が必要であり、その作業には質量分析や科学に関する知見と多くの時間が求められた。
今回我々は、GC-MSデータを用いた手動構造解析の困難さの課題解決として、深層学習によるマススペクトル予測を組み込んだ網羅的な構造解析手法(以後AI構造解析と称す)を搭載したmsFineAnalysis AIを開発した。AI構造解析手法では上述した統合解析で得た情報と深層学習モデルにより得た予測マススペクトルを用いて構造を推定する。本MSTipsではmsFineAnalysis AIの高分子材料への適用例について紹介する。
AI構造解析
Fig.1に今回開発したAI構造解析フローを示す。本手法では深層学習を用いて、構造式からEIマススペクトルを予測するモデルを構築した。我々は約1億個の化合物構造式を用意し、構造式から予測されるEIマススペクトルを作成した。構造式とそれに紐づく予測EIマススペクトルを"AIライブラリー"データベースとしてソフトウェアに内包させ、従来のライブラリーデータベース検索と同様にスペクトルパターンによるデータベース検索機能を実装した。
msFineAnalysis AIでは、1億個全ての予測マススペクトルを用いた総当たりのデータベース検索ではなく、統合解析にて一意に決定した分子式による構造式候補の絞り込みを行っており、より正しい構造式が迅速に得られるよう工夫されている。そのため、AI構造解析においてもソフトイオン化法及び精密質量解析による分子式の決定は重要な役割をもっている。
分子式で絞り込まれた予測EIマススペクトルと、実測のEIマススペクトルとをスペクトルパターンによるスコア計算を行い、構造式候補をスコア順に掲載する。得られた構造式候補と、サンプル情報、今までの分析結果の知見・ノウハウなどを合わせ、最終的に正しい構造式を選択する。
Fig.1 msFineAnalysis AI workflow for the structural analysis of unknowns
実験
試料は市販の酢酸ビニル樹脂を用いた。試料の前処理装置として熱分解装置を使用し、熱分解生成物分析を実施した。イオン源はEI/FI共用イオン源を用いた。得られたデータをmsFineAnalysis AI(日本電子製)にて解析した。測定条件をTable1に示す。
Table 1 Measurement and analysis conditions
Pyrolysis conditions | |
---|---|
Pyrolyzer | EGA/PY-2020D(Frontier Lab) |
Pyrolysis Temperature | 600°C |
GC conditions | |
---|---|
Gas Chromatograph | 7890 GC (Agilent Technologies) |
Column | DB-5msUI (Agilent) 15m x 0.25mm, 0.25μm |
Oven Temperature | 50°C (1min) -30°C/min - 330°C (1.7min) |
Injection Mode | Split mode (100:1) |
Carrier flow | He:1.5mL/min |
MS conditions | |
---|---|
Spectrometer | JMS-T200GC (JEOL Ltd.) |
Ion Source | EI/FI combination ion source |
Ionization | EI+:70eV, 300μA FI+:-10kV, 6mA/10msec (Carbotec) |
Mass Range | m/z 35-800 |
Data processing condition | |
---|---|
Software | msFineAnalysis AI (JEOL Ltd.) |
Library database | NIST20, AI Library (JEOL Ltd.) |
結果
Fig.2 にPy-GC-EI及びFI測定で得られたTICクロマトグラムを示す。市販の酢酸ビニル樹脂からは、RT8.45minに可塑剤として使用されるDiethylene Glycol Dibenzoate(ID [134])が観測された。さらに本成分の熱分解生成物と予想される成分がID[085]、[108]、[127]に観測された。これらは全てNISTライブラリーデータベース未登録化合物であった。そこで、これら3成分に対してAI構造解析を実施し、 Diethylene Glycol Dibenzoateから予想される熱分解生成物構造式との比較を行った。
Fig.3にDiethylene Glycol Dibenzoateとこれら3成分の実測EIマススペクトル(上段、黒)と、予想した構造式(スペクトル右横)とその予測EIマススペクトル(下段、赤)を示す。なおDiethylene Glycol Dibenzoateに関しては予測EIマススペクトルではなく、NISTライブラリーデータベース掲載のEIマススペクトルを下段に青色で表示している。
Fig.2 Py-GC-EI and FI TIC chromatograms for Poly(vinyl acetate).
Fig.3 Measured EI mass spectra and predicted EI mass spectra of the proposed structural formula for ID[085], [108], [127], [134] in Fig.2.
Table2にAI構造解析によって得られた結果の一覧を示す。 msFineAnalysis AIでは実測EIマススペクトルと予測EIマススペクトル間で、コサイン類似度を使ったスコア(最高999)を計算している。表中の"AI Score"が前述した類似度を示しており、"Rank"がFig.3掲載の構造式のスコア順位、"Total"が構造式候補数を示している。今回解析した3成分においては、 Diethylene Glycol Dibenzoateの構造式から充分に考えられる構造式を解析結果として採用しているが、全てスコア850以上が得られており高い類似度を示した。事実、実測マススペクトルで観測されているフラグメントイオンと、予測マススペクトル中のフラグメントイオンはよく一致していた。また、構造式候補数はいずれも2,000を超えていたが、3成分において予想した構造式が1位ないし2位の候補として得られていた。
Table 2 AI structual analysis result
結論
本MSTipsでは新たに開発したAI構造解析手法を搭載したソフトウェアmsFineAnalysis AIの高分子材料への適用例について紹介した。今回はNISTライブラリーデータベース未登録の3成分に対してAI構造解析を実施し、Diethylene Glycol Dibenzoateの熱分解生成物として充分考えられる構造式と比較することで得られたAI構造解析結果について評価した。スペクトルパターン比較では、コサイン類似度スコアは全て850以上が得られており、AIによる予測マススペクトルは実測マススペクトルに対して高い類似度を示した。また構造式候補数はいずれも2,000を超えていたが、3成分全てにおいて予想した構造式が1位ないし2位の候補として得られていた。AIによる構造式予測が高い精度を示しており、添加剤や熱分解生成物の構造解析においても本手法が有効であることが示された。
今まで手動で行われた構造解析に対して、msFineAnalysis AIでは構造解析を自動で行う。GC-MS定性分析/構造解析における有益なツールであり、今後様々なGC-MS定性分析シーンにおける活用が期待される。