msFineAnalysis AIを用いたアクリル樹脂熱分解生成物の構造解析
MSTips No. 389
MSTips No. 389
はじめに
ライブラリーデータベース(DB)未登録の化合物の定性分析では、分子イオンやプロトン付加分子を与えやすいソフトなイオン化法と精密質量測定ができる飛行時間型質量分析計(TOFMS)の組み合わせが有用である。 電界イオン化(FI)法などのソフトイオン化法にて分子イオンを観測し、更に精密質量に対して組成推定を行うことでDB未登録の未知化合物であってもその分子式を決定できる。弊社ではEI法とソフトイオン化法で得た2つのマススペクトルを用いた定性解析手法を"統合解析"とし、これを搭載したソフトウェアmsFineAnalysisを2018年にリリースした。
TOFMSを用いた統合解析ではフラグメントイオンの組成式も得られるため、部分構造情報を得ることができる。また、部分構造情報と分子式情報を組み合わせることで化合物の構造解析が可能になる。しかし、最終的な構造推定については解析者自身による考察が必要であり、その作業には質量分析や科学に関する知見と多くの時間が求められた。
今回我々は、GC-MSデータを用いた手動構造解析の困難さの課題解決として、深層学習によるマススペクトル予測を組み込んだ網羅的な構造解析手法(以後AI構造解析と称す)を搭載したmsFineAnalysis AIを開発した。AI構造解析手法では上述した統合解析で得た情報と深層学習モデルにより得た予測マススペクトルを用いて構造を推定する。本MSTipsではmsFineAnalysis AIの高分子材料への適用例について紹介する。
AI構造解析
Fig.1に今回開発したAI構造解析フローを示す。本手法では深層学習を用いて、構造式からEIマススペクトルを予測するモデルを構築した。我々は約1億個の化合物構造式を用意し、構造式から予測されるEIマススペクトルを作成した。構造式とそれに紐づく予測EIマススペクトルを"AIライブラリー"データベースとしてソフトウェアに内包させ、従来のライブラリーデータベース検索と同様にスペクトルパターンによるデータベース検索機能を実装した。
msFineAnalysis AIでは、1億個全ての予測マススペクトルを用いた総当たりのデータベース検索ではなく、統合解析にて一意に決定した分子式による構造式候補の絞り込みを行っており、より正しい構造式が迅速に得られるよう工夫されている。そのため、AI構造解析においてもソフトイオン化法及び精密質量解析による分子式の決定は重要な役割をもっている。
分子式で絞り込まれた予測EIマススペクトルと、実測のEIマススペクトルとをスペクトルパターンによるスコア計算を行い、構造式候補をスコア順に掲載する。得られた構造式候補と、サンプル情報、今までの分析結果の知見・ノウハウなどを合わせ、最終的に正しい構造式を選択する。
Fig.1 msFineAnalysis AI workflow for the structural analysis of unknowns
実験
試料は市販のアクリル樹脂(メタクリル酸メチルとアクリル酸メチルの共重合体)を用い、試料量はEI法では0.2mg、FI法では0.9mgとした。試料の前処理装置として熱分解装置を使用し、熱分解生成物分析を実施した。イオン源はEI/FI共用イオン源を用いた。得られたデータをmsFineAnalysis AI(日本電子製)にて解析した。測定条件をTable1に示す。
Table 1 Measurement and analysis conditions
Pyrolysis conditions | |
---|---|
Pyrolyzer | EGA/PY-3030D(Frontier Lab) |
Pyrolysis Temperature | 600°C |
GC conditions | |
---|---|
Gas Chromatograph | 8890 GC (Agilent Technologies) |
Column | ZB-5MSi (Phenomenex) 30m x 0.25mm, 0.25μm |
Oven Temperature | 40°C (2min) -10°C/min - 320°C (15min) |
Injection Mode | Split mode (100:1) |
Carrier flow | He:1.0mL/min |
MS conditions | |
---|---|
Spectrometer | JMS-T2000GC (JEOL Ltd.) |
Ion Source | EI/FI combination ion source |
Ionization | EI+:70eV, 300μA FI+:-10kV, 40mA/30msec |
Mass Range | m/z 35-800 |
Data processing condition | |
---|---|
Software | msFineAnalysis AI (JEOL Ltd.) |
Library database | NIST20, AI Library (JEOL Ltd.) |
結果
AI構造解析結果と参考文献の比較
観測されたアクリル樹脂熱分解生成物のうち、NISTライブラリーデータベースに未登録で、且つ参考文献[1]で構造式が提案されている4成分についてAI構造解析を実施し、その効果を検討した。
Fig.2 にPy-GC-EI及びFI測定で得られたTICクロマトグラムを示す。図中のID[038]、[040]、[055]、[063]が今回解析対象とした4成分である。そして、Fig.3にこれら4成分の実測EIマススペクトル(上段、黒)と、参考文献で提案されている構造式(スペクトル右横)とその予測EIマススペクトル(下段、赤)を示す。
Fig.2 Py-GC-EI and FI TIC chromatograms for an Methyl methacrylate-methyl acrylate copolymer.
Fig.3 Measured EI mass spectra and predicted EI mass spectra of the proposed structural formula in reference [1] for ID[038], [040], [055], [063] in Fig.2.
Table2にAI構造解析によって得られた結果の一覧を示す。msFineAnalysis AIでは実測EIマススペクトルと予測EIマススペクトル間で、コサイン類似度を使ったスコア(最高999)を計算している。表中の"AI score"が前述したコサイン類似度を使ったスコアを示しており、"Rank"がFig.3掲載の構造式のスコア順位、"Total"が構造式候補数を示している。今回解析した4成分においては、全てスコア750以上が得られており高い類似度を示した。事実、実測マススペクトルで観測されているフラグメントイオンと、予測マススペクトル中のフラグメントイオンはよく一致していた。また、構造式候補数はいずれも3,000を超えていたが、4成分中3成分において参考文献で提案されている構造式が上位1%の候補として得られていた。
Table 2 AI structual analysis result
結論
本MSTipsでは新たに開発したAI構造解析手法を搭載したソフトウェアmsFineAnalysis AIの高分子材料への適用例について紹介した。
今回はNISTライブラリーデータベース未登録の4成分に対してAI構造解析を実施し、参考文献提案の構造式と比較することで得られたAI構造解析結果について評価した。スペクトルパターン比較では、コサイン類似度スコアは全て750以上が得られており、AIによる予測マススペクトルは実測マススペクトルに対して高い類似度を示した。また構造式候補数はいずれも3,000を超えていたが、4成分中3成分において参考文献で提案されている構造式が上位1%の候補として得られていた。AIによる予測が高い精度を示しており、熱分解生成物の構造解析においても本手法が有効であることが示された。
今まで手動で行われた構造解析に対して、msFineAnalysis AIでは構造解析を自動で行う。GC-MS定性分析/構造解析における有益なツールであり、今後様々なGC-MS定性分析シーンにおける活用が期待される。
参考文献
Shin Tsuge, Hajime Ohtani, Chuichi Watanabe (2011), Pyrolysis - GC/MS Data Book of Synthetic Polymers, Elsevier