ホームニューステックニュース化合物をダウンロードして分類・回帰する：chembl-webresource-client × RDKit × RandomForest #Python

化合物をダウンロードして分類・回帰する：chembl-webresource-client × RDKit × RandomForest #Python

2025年6月22日

5

化合物をダウンロードして分類・回帰する：chembl-webresource-client × RDKit × RandomForest #Python

次のコードについて解説してください。

!pip install chembl-webresource-client pandas matplotlib

このコードは、Pythonのパッケージ管理ツール pip を使って、以下の3つのライブラリをインストールするコマンドです。

!pip install chembl-webresource-client pandas matplotlib

molecule_chembl_id	standard_value	canonical_smiles
CHEMBL1	10	CCCO
CHEMBL2	50	CCN(CC)C=O
CHEMBL3	5	C1=CC=CC=C1

molecule_chembl_id	standard_value	canonical_smiles
CHEMBL4	8	COCCO
CHEMBL5	12	CCCCCC
CHEMBL6	6	C1=CC=C(O)C=C1

化合物をダウンロードして分類・回帰する：chembl-webresource-client × RDKit × RandomForest #Python

いいね:

関連

ブラウザ機能テスト – CodePen

Next.js と React のアップグレード – CodePen

Chris のコーナー: AI ブラウザ – CodePen

返事を書く返事をキャンセル

ABOUT US

FOLLOW US

「融合型RPG『アークナイツ』試遊！工業シミュも楽しめる」

「プラダ悪魔2」予告解禁！再共演の魅力が炸裂！

「PS5必見！『S.T.A.L.K.E.R. 2』の魅力8選」

化合物をダウンロードして分類・回帰する：chembl-webresource-client × RDKit × RandomForest #Python

1. ! の意味

2. インストールされるライブラリ

① chembl-webresource-client

② pandas

③ matplotlib

3. 実行後の動作

補足：

1. ライブラリのインポート

2. ChEMBL API から活性データを取得

3. データを pandas の DataFrame に変換

4. データの前処理（欠損値処理 & 数値変換）

5. DataFrame の表示

このコードの目的

追加できる改善点

① standard_value の単位の統一

② ヒストグラムの描画

1. コードの解説

(1) df["target_chembl_id"].value_counts()

2. 実行後のデータ構造

3. 可視化（ヒストグラムや棒グラフ）

(1) 上位 10 ターゲットの棒グラフ

(2) 頻度分布のヒストグラム

4. 応用

(1) 特定の標的のデータを抽出

(2) 特定のターゲットの IC50 値の分布を確認

5. まとめ

コードの詳細な解説

1. 各標的タンパク質 (target_chembl_id) の出現頻度を集計

2. ChEMBL API から標的情報を取得

3. DataFrame への変換

4. 標的名（target_name）を追加

5. DataFrame の表示

このコードの目的

応用：可視化

まとめ

1. 必要なライブラリのインポート

2. fetch_and_save_chembl_data() 関数の定義

3. Google Drive をマウント

4. 保存先ディレクトリを作成

5. n 番目のターゲットを取得

6. ChEMBL API から IC50 データを取得

7. データを DataFrame に変換

8. CSV ファイルとして保存

9. 関数の戻り値

📌 コードの詳細な解説

1. 空の辞書 df_dict を作成

2. target_counts_df をループ処理

3. 各ターゲットの情報を表示

4. fetch_and_save_chembl_data() を実行

5. df_dict に取得データを保存

6. 取得データを表示

📌 処理の流れ

📌 実行後の df_dict の構造

📌 まとめ

📌 RDKit とは？

📌 !pip install rdkit の詳細

📌 RDKit の動作確認

📌 まとめ

📌 コードの詳細な解説

1. 必要なライブラリをインポート

2. draw_smiles_grid(df) 関数

関数の引数

3. canonical_smiles の取得

4. SMILES 文字列を分子オブジェクトに変換

5. 分子構造をグリッドで描画

6. 画像を表示

📌 使用例

📌 まとめ

📌 コードの解説

1. df_dict とは？

2. forループでデータを処理

3. ターゲット名を出力

4. standard_value（IC50値）でソート

5. draw_smiles_grid() を使って化学構造を可視化

📌 処理の流れ

📌 具体例

返事を書く返事をキャンセル