熱分解GC-TOFMSとAI構造解析によるポリマー熱分解生成物の構造解析 -in silico熱分解生成物を収録したAIライブラリーによる解析事例-
MSTips No.498
はじめに
我々はGC-MSにおける未知物質構造解析ソリューションとして、高質量分解能GC-MSである飛行時間質量分析計(TOFMS)のデータと、深層学習によるマススペクトル予測を組み合わせた自動構造解析手法[1](以後AI構造解析と称す)を搭載したmsFineAnalysis AIを開発し、2022年にリリースした。本ソフトウェアには、PubChemデータベース(DB)から取得した約1億化合物の構造式と予測EIマススペクトルのDB(以後AIライブラリーと称す)が収録されており、統合解析[2]により決定した分子式情報を活用することで、迅速に未知物質の構造式を推定することが可能である。
熱分解GC-MS法は、樹脂などの固体高分子試料を分析する手法として広く用いられている。熱分解GC-MSで観測される熱分解生成物の多くは市販のEIマススペクトルDBに未登録であり、これら未知物質の構造解析手法を求める声が多かった。これに対して、上記AIライブラリーを用いた解析を試みたところ、アクリル樹脂中の未知物質構造解析を精度よく行えることが確認できた(MSTips No. 389)。一方で、トライマーなどのオリゴマー成分において、AIライブラリー中にも近しい構造式が存在しないと思われる結果も得られた。これはPubChem DB中にも熱分解生成物の構造式の登録が少ないことに起因すると考えられる。
そこで我々は、in silicoで熱分解生成物構造式を網羅的に作成し、新たに約2500万の熱分解生成物の予測EIマススペクトルを収録したAIライブラリーを作成した。そして2024年に、熱分解生成物を含む約1.2億化合物を収録した新しいAIライブラリーを搭載するmsFineAnalysis AI ver.2をリリースした。本MSTipsでは、 msFineAnalysis AI ver.2搭載のin silico熱分解生成物のAIライブラリーを用いた解析事例について報告する。
実験
試料は市販のアクリル樹脂(メタクリル酸メチルとアクリル酸メチルの共重合体)を用いた。試料前処理装置は熱分解装置EGA/PY-3030D(フロンティア・ラボ株式会社製)使用した。GC-MSはJMS-T2000GC(日本電子製)を用い、イオン源はEI/FI共用イオン源を用いた。得られたデータをmsFineAnalysis AI ver.2(日本電子製)にて解析した。測定条件詳細については MSTips No.389を参照のこと。
in silico熱分解生成物
in silico熱分解生成物の構造式は以下の手順で作成した。今回作成したホモポリマー及びコポリマー種をTable 1に示す。
① 49種類のモノマー化合物を選定[3]
② そこから、49種類のホモポリマー及び18種類のコポリマーの、6量体(ヘキサマー)の直鎖構造式を生成
③ 『②』の構造式の1~5個の単結合をランダムに開裂させた構造式を生成
④ 『③』の構造式における開裂位置に対して、水素付加もしくは二重結合に置換
⑤ 『②』、『③』の処理を全パターンで行い、熱分解生成物構造式を作成
得られた約2500万の熱分解生成物構造式を、開発した深層学習モデルにインプットし、約2500万化合物の予測EIマススペクトルを得た。
Table 1 Polymer list of the predicted EI mass spectrum DB for 25 million in silico pyrolyzates

結果
Fig.1に熱分解GC-TOFMS測定で得られたTICクロマトグラムを示す。今回は観測されたアクリル樹脂熱分解生成物のうち、保持時間14~20分のトライマー領域(一部ダイマーも存在)に検出された48成分の解析を行った。

Fig.1 Py-GC-EI and FI TIC chromatograms for an acrylic resin.
トライマー領域で検出された48成分のうち、NIST23 DB登録化合物数はわずか2成分であった。AIライブラリーで解析できた残りの46成分のうち、PubChem DB由来が26成分、そして今回作成したin silico熱分解生成物に該当した化合物は20成分であった。トライマー領域化合物のおよそ4割をin silico熱分解生成物の情報から構造式を推定することができた。
Fig.2にmsFineAnalysis AIにおける解析結果画面と18.63分に観測されたID:045のマススペクトル及び推定構造式を示す。この成分は、EI法では分子イオンは殆ど観測されていなかったが、FI法では分子イオンと考えられるm/z 300.15728をベースピークとして検出することができた。またその分子式は高い質量精度をもってC15H24O6と推定された。msFineAnalysis AIではAI構造解析を行う際、分子式情報をフィルターとして使用し、その候補数を減らしている。ID: 045成分の場合、 C15H24O6を分子式としてもつ構造式(異性体)は7529であり、約1.2億化合物のAIライブラリーから大幅に候補の構造式を減らすことができた。そして7529候補の中でもっともスコアが高かった構造式は、ポリアクリル酸メチルから生じ得るin silico熱分解生成物であった。

Fig.2 msFineAnalysis AI result window,
ID: 045 mass spectra and estimated structure by in silico pyrolyzates
Fig.3に in silico 熱分解生成に該当した化合物の推定構造式を示す。今回測定したアクリル樹脂(メタクリル酸メチルとアクリル酸メチルの共重合体)の構造を反映したトライマー成分を確認することができた。

Fig.3 Estimated structures for 20 compounds in the trimer region
using AI structure analysis and in silico pyrolyzates information
結論
本MSTipsでは、検出成分の殆どがNIST DB未登録なアクリル樹脂のトライマー領域における構造解析事例について紹介した。msFineAnalysis AI ver.2では新たに2500万の熱分解生成物の予測EIマススペクトルを収録しており、より精度高い熱分解GC-MS定性解析が可能となった。今後様々な固体高分子試料の熱分解GC-MS定性分析での活用が期待される。
参考文献
[1] A. Kubo et al, Mass Spectrometry, 2023, 12, A0120.
[2] M. Ubukata et al, Rapid Commun Mass Spectrom., 34 (2020 ). DOI: 10.1002/rcm.8820
[3] Shin Tsuge, Hajime Ohtani, Chuichi Watanabe (2011), Pyrolysis - GC/MS Data Book of Synthetic Polymers, Elsevier
