「100万化合物の中から、どうやって一つを見つけるんですか?」
瀬奈が圧倒された表情でデータベースを見つめた。
「類似性検索だ」アキラが答えた。
「類似性?」
「既知の活性化合物に似た化合物を探す。似ていれば、活性も似ている可能性が高い」
エイジが補足した。「類似性原理。ケモインフォマティクスの基本だ」
「でも、何をもって『似ている』と判断するんですか?」
アキラが説明を始めた。「分子記述子だ。化合物の特徴を数値で表現する」
「どんな特徴?」
「分子量、LogP、水素結合ドナー数、アクセプター数…」
「それだけ?」
「いや、もっと複雑な記述子もある。フィンガープリントとか」
「フィンガープリント?」
「分子の部分構造をビット列で表現したものだ。例えば、ベンゼン環があれば1、なければ0」
瀬奈が理解した。「構造をデジタル化するんですね」
「そう。ECFP、MACCS keys、色々な種類がある」
エイジが実演した。「この活性化合物のフィンガープリントを計算する」
画面に0と1の列が表示された。
「次に、データベース全体とTanimoto類似度を計算する」
「Tanimoto?」
「共通のビット数を、全体のビット数で割った値。0から1の間だ」
「1に近いほど似ている?」
「正解」
計算が始まった。100万化合物、数分で完了。
「上位100化合物を抽出」アキラが操作した。
リストが表示される。Tanimoto係数0.7以上。
「この中にヒット化合物がある可能性が高い」
瀬奈が疑問を持った。「でも、似すぎていたら、既知化合物と変わらないのでは?」
「鋭い」エイジが感心した。「だから、適度な類似性が理想だ」
「適度って?」
「0.5から0.7くらい。コアは保ちつつ、新規性もある」
アキラが別の手法を紹介した。「スキャフォールドホッピングという技もある」
「スキャフォールド?」
「分子の骨格だ。それを全く違う骨格に置き換える」
「似てないのに、活性は保つ?」
「そう。三次元形状と薬理基が似ていれば、骨格が違っても活性を示すことがある」
瀬奈が混乱した。「でも、それは類似性検索じゃないですよね」
「構造的類似性じゃなく、形状的類似性だ」
エイジが補足した。「だから、3Dフィンガープリントを使う。立体配座を考慮した記述子だ」
「複雑…」
「でも、強力だ。特許回避とか、新規性確保に有効」
アキラがヒット化合物の一つを拡大した。
「これが今回の候補だ。Tanimoto係数0.65」
「ちょうどいい類似性ですね」
「そう。でも、これで終わりじゃない」
「まだ何かあるんですか?」
エイジが説明した。「ドッキングで検証する。類似性が高くても、結合しない場合がある」
「なんで?」
「二次元の類似性と、三次元の適合性は別だからだ」
アキラが続けた。「だから、類似性検索はスクリーニングの第一段階。次にドッキング、そして実験」
瀬奈がノートにまとめた。「類似性検索→ドッキング→実験。段階的に絞り込む」
「そう。各段階で候補が減る。最初100万が、最後は10以下になる」
「効率的ですね」
「でも」エイジが警告した。「完璧じゃない。類似性検索で見逃す化合物もある」
「見逃す?」
「既知化合物と全く似ていないけど、活性を持つ化合物。新規骨格だ」
「それは見つけられない?」
「類似性検索では難しい。だから、ランダムスクリーニングやフェノタイプスクリーニングも併用する」
アキラが締めくくった。「類似性検索は道具の一つだ。万能じゃないけど、有用だ」
瀬奈が画面を見つめた。100万化合物という海。その中に沈んだ一つのヒット化合物。類似性という糸を辿って、それを引き上げる。
「見つけた化合物が、本当に効くといいですね」
「それは実験が教えてくれる」エイジが微笑んだ。
類似性検索の旅は、まだ始まったばかりだ。