あの曲に出てくるアレ。
ケモインフォマティクスや代謝経路を勉強していると、名前が長すぎて舌がもつれそうな化合物に出会います。
例えば”Phosphoribosylaminoimidazolesuccinocarboxamide”。略してSAICAR。
れっきとした生体内代謝中間体です。
この化合物をRDKitで再現し、その構造を見てみましょう。
環境構築
RDKitはPythonの化学情報学ライブラリのデファクト。
conda-forgeチャンネルから環境作成。
conda create -c conda-forge -n rdkit-env rdkit jupyterlab -y
conda activate rdkit-env
Phosphoribosylaminoimidazolesuccinocarboxamide
SAICARのSMILESから分子を作り、構造を可視化してみます。
from rdkit import Chem
from rdkit.Chem import Draw
smiles = "O=C(O)C[C@@H](C(=O)O)NC(=O)c1ncn(c1N)[C@@H]2O[C@@H]([C@@H](O)[C@H]2O)COP(=O)(O)O"
mol = Chem.MolFromSmiles(smiles)
# 分子の原子数を確認
print(f"原子数: {mol.GetNumAtoms()}")
# 分子イメージを表示(Jupyterならこのまま描画可能)
Draw.MolToImage(mol)
RDKitは複雑な生体分子も扱えて、様々な解析や分子設計に活用できます。
ここで立体配置を反映したSMILESを使うことで、実際の生物分子の形状に近いモデルを再現しています。
難解分子を身近に感じる一助になれば幸いです。
興味があればRDKitで他の代謝物も試してみてください。
Views: 0