Science of Synthesis (SOS) は、評価済み合成方法を収録した有機化学・有機金属化学分野における
最大級のコレクションです。各分野の専門家によりキュレートされた高品質な化学データを
一貫したフォーマットで提供し、最適で信頼性の高い合成ルートを示しています。
Thiemeは、このSOSデータを逆合成解析やフォワード反応予測のためのAIモデルのトレーニングに
利用可能な機械可読形式のデータに変換しました。
IBM社とのコラボプロジェクトでは、特許データにSOSデータセットを組み合わせることで、
IBMの化学反応予測AIモデルRXNの精度がフォワード反応予測で3倍、逆合成解析で9倍向上しました。
SOSデータセットは*47万件以上の化学反応、230万以上の分子、2,400以上のPDFファイル、
6万件以上の実験手順を含む80,000以上のXMLファイルを含み、ダイレクトに運用可能な機械可読データ形式で提供されます。
(*2024年10月時点)
IBM Research Europe, Science of Synthesis and Synfacts – Thieme Chemistry
https://www.thieme.de/en/thieme-chemistry/ibm-research-europe-and-science-ofysnthesis-and-synfacts-166037.htm
Science of Synthesis (SOS) データセットについてのお問合せは
e-port@sunmedia.co.jp までご連絡ください。