創薬研究者が解説。論文探索AI「KIBIT Amanogawa」による目的に応じた検索事例
2024.03.25~Axcelead Drug Discovery Partners×FRONTEO共催セミナー~創薬研究における 仮説生成AIの活用とターゲットバリデーション
2024.05.14研究者達は日々更新される最新情報をキャッチしながら、遺伝子と遺伝子、あるいは遺伝子と疾患との関連性を確認し、仮説検証することを繰り返しています。しかしながら、すべての情報を繋ぎ合わせ、その関連性を俯瞰的・網羅的に把握することは容易ではありません。弊社独自の自然言語処理AIエンジン「KIBIT」は現在明らかとなっている情報を学習し、その先にある可能性も含めた関連性を俯瞰的・網羅的に提示してくれます。
株式会社FRONTEO
ライフサイエンスAI事業本部 ライフサイエンスAI研究チーム
髙橋 記代子
東京理科大学大学院を卒業後、大正製薬株式会社に入社。免疫、感染症領域にて創薬の薬理研究に従事。現在、Drug Discovery Best Known Methods (DD-BKM) を用いた解析、仮説生成を担当
新規性の高い仮説を生み出す方法
最初に、新規性の高い仮説を生み出す方法としてDrug Discovery Best Known Methodsについて簡単に解説します。
Drug Discovery Best Known Methods(DD-BKM)
Drug Discovery Best Known Methodsは、弊社独自の自然言語処理AIエンジンKIBITと創薬研究者との融合によって開発された解析ツールで、重複差分解析、Virtual Experiments、ベクトル加算解析、多面的解析、そして二次元マッピング解析の5つにツールが含まれています。今回は、「二次元マッピング解析」についてご紹介します。
二次元マッピング解析とは
自然言語処理の基本概念:分布仮説による単語のベクトル化
弊社の自然言語処理は「分布仮説」に基づいて行われています。分布仮説とは1950年代に提唱された、「ある単語はその前後で使用される単語によって特徴付けられている」という仮説です。
例えば、Alcoholという単語は様々な意味を持っていますが、文章中で使われている意味は、その前後の言葉によって変わってきます。このような非構造化情報を、分布仮説を用いて構造化情報へと変換し、ベクトル化します。
ベクトル化の方法を簡単にお示しします。文書中で、その前後の指定範囲内に出現した単語の頻度を集計します。例えばAlcoholという単語の周りにContentという単語が122回出現したという結果を示しています。こういった集計を様々な単語に対して行い、それを元に単語をベクトル、数値で表現します。スライドの表はイメージを表しており、実際にはもう少し複雑な解析を行っていますが、上記に示したような法則に従い、単語をベクトル化していくことが可能となります。
ベクトルの類似性から思いもよらない繋がりを発見
Alcoholが含まれる大量のテキスト情報を学習させることで、Alcoholの周りに現れる単語の頻度を用いてAlcoholのベクトルを作成します。
続いて同様に単語Xが含まれる大量のテキスト情報を学習させて、同じようにXの周りに現れる単語の頻度を用いて単語Xのベクトルを作成します。
この単語Xが文中でAlcoholと非常に似た使われ方をしていた場合、Alcoholのベクトルと単語Xのベクトルは非常に似たようなベクトルとなり、Alcoholと単語Xは概念的に類似していることが示されます。
研究者自身が注力している専門分野であれば、こういった遺伝子と遺伝子、遺伝子と疾患の概念的な類似性・関連性に気づくことはあるかもしれませんが、領域を超えた範囲で、遺伝子と遺伝子や、遺伝子と疾患の関連性に気が付くことが困難であることはご理解いただけるかと思います。
弊社のKIBITを使えば、遺伝子や疾患等、様々なものをベクトル化することが可能となり、そのコサイン類似度から、概念的な類似性に気が付くことが可能となります。その概念的な類似性から、これまで報告がなかったような遺伝子と遺伝子、遺伝子と疾患の関連性を発見することが可能になります。
二次元マッピング解析
二次元マッピング解析では、自然言語処理AIエンジンKIBITが数百次元でベクトル化した遺伝子や疾患、症状などをベクトル平面にプロットすることで可視化します。
自然言語処理の特徴により、概念的に類似するものは近傍にプロットされるため、似たような疾患や症状はコロニーを形成してプロットされます。そのため、類似性・関連性に気づきやすい構造になっています。
また、注目遺伝子と関連する疾患や症状を俯瞰的に捉えることが可能です。ベクトル化が可能なものであれば、症状であっても化合物であっても同一のマップにプロットすることができます。
さらに、注目遺伝子に近接する疾患や症状の中から思いもよらない疾患を網羅的に探索することが可能となり、通常のキーワード検索では検出できないような遺伝子と疾患の関連性等も見出すことが可能となっています。
通常のキーワード検索では検出できない遺伝子と疾患の関連性については、さらに弊社の論文検索ツールKIBIT Amanogawaで探索することで、仮説生成のためのヒントを得ることが可能となります。
二次元マッピング解析を用いた適応症探索の事例
続いて、二次元マッピング解析を用いた適応症の探索について、事例を交えてご紹介します。
注目遺伝子 FAAH:脂肪酸アミド加水分解酵素
今回は、脂肪酸アミド加水分解酵素であるFAAHに注目して解析を実施しました。FAAHは、エンドカンナビノイドであるアナンダミド(AEA)の主な加水分解酵素として報告されています。
FAAH阻害剤は、疾患モデル等において、鎮痛作用や抗炎症作用、抗うつ作用等多岐にわたる有効性を示すことが報告されています。
そのため、いくつかのFAAH阻害剤が開発されており、スライドにあげたような疾患で開発が進められていました。しかし、いずれも主に薬効不足のために、開発は中止している状況です。
今回はこのFAAHをターゲットとする新たな適応症を探索することを目的として、二次元マッピング解析を実施しました。
二次元マッピングを用いた適応症探索の手法【事例】
最初に、遺伝子と疾患・症状をベクトル化して、ベクトル平面にプロットします。次に注目遺伝子FAAH周辺の疾患・症状から、適応症候補となる疾患を探索します。
FAAH周辺の疾患を確認すると、角化症や皮膚の肥厚性障害といったケラチノサイトに関与する疾患が多いことが分かりました。
その中でも、接合型表皮水疱症や単純型表皮水疱症といったものがいくつかプロットされており、今回はこの表皮水疱症に注目して解析を進めることにしました。
FAAHと表皮水疱症の関連報告
ちなみに、このFAAHと表皮水疱症をPubMedにて検索すると、No resultsとなりました。このことからも、二次元マッピングが単純なキーワード検索ではヒットしないもしくはヒット数の少ない疾患との関連性も示してくれることが分かります。
表皮水疱症とは(指定難病)
続いて、表皮水疱症について簡単にご説明いたします。正常な皮膚では、表皮と基底膜、基底膜と真皮が、接着構造分子によってタイトに接着しており、強固な皮膚バリアを形成しています。表皮水疱症は、この接着構造分子が生まれつき少ないか、消失している遺伝性の難病です。
表皮水疱症の患者様は日常生活で皮膚に些細な力が加わることでも耐えることができず、表皮が真皮から剥がれて、疼痛を伴う水疱や皮膚潰瘍を生じます。症状の重症度は水疱の形成及び瘢痕形成の重症度と相関することが報告されています。
表皮水疱症は原因遺伝子や障害部位によって、大きく4つの型に分類されています。
単純型は、障害部位は表皮で、重症の場合は過角化を生じることが報告されています。接合型は、表皮と基底膜の間で障害を生じ、重度の場合は瘢痕形成を生じます。栄養障害型は、基底膜と真皮の間で障害を生じ、瘢痕形成と稗粒腫を生じることが特徴です。そしてキンドラー症候群は、いずれの部位でも水疱を生じることが報告されています。
発症頻度は10万~20万人に1人と言われており、国内では500~1000人の患者様がいると推定されています。発症年齢は約9割が1歳未満で、現段階では根本的な治療方法はなく、清潔なガーゼで傷口を覆うといった対象療法のみとなっています。
ただし、栄養障害型に関しては、原因遺伝子であるコラーゲン7の遺伝子を皮膚病変局所に直接経皮投与する遺伝子治療が昨年2023年にFDAによって承認されました。その他の型に関しては、根本的な治療薬が望まれています。
表皮水疱症患者に対するカンナビジオールの治療効果
FAAHと表皮水疱症に関して解析を進めたところ、外因性のカンナビノイルであるカンナビジオールオイルの自己使用によって、水疱の改善を認めた症例報告がありました。
こちらは標準治療として抗菌薬、消炎鎮痛剤、保湿剤、モルフィネを投与されている患者様です。そこにカンナビジオール処置を追加したところ、報告されていた3例すべてにおいて創傷治癒の促進と水疱形成の減少、また疼痛の改善を認めました。
3例中1名の患者様においては、この経口オピオイド鎮痛剤から完全に離脱されたことが報告されました。
栄養障害型の患者様では、治療前においては多発する無傷の水疱と皮膚の無形成が認められていますが、治療6ヶ月後には水疱は小さくなって皮膚の無形成は消失しています。
単純型の患者様においては、来院時に無傷の水疱と皮膚びらんが多数ありましたが、治療開始8ヶ月後には水疱とびらんはほとんどない状況になり、カンナビジオールが表皮水疱症の治療に有効であると考えられます。
皮膚組織でのエンドカンナビノイドシステムとFAAHの役割
カンナビジオールは外因性のカンナビノイドであるため、皮膚組織でのエンドカンナビノイドシステムについて調査を進めました。
皮膚のエンドカンナビノイドであるアナンダミドや2-AGについては、ケラチノサイトや感覚神経、線維芽細胞等から産生することが報告されています。
エンドカンナビノイドは、ケラチノサイトや免疫細胞等の表面に発現するカンナビノイド受容体のCB1RやCB2R等を活性化することで皮膚の生理活性に影響を与えることが報告されています。
FAAHは、アナンダミドの分解を行うことで皮膚のエンドカンナビノイドの濃度調整を行うことが報告されており、皮膚でのFAAHの発現量はケラチノサイトやランゲルハンス等、表皮にて発現が高いことが報告されています。
FAAHを抑制することで、皮膚のアナンダミドの濃度が上昇することが期待でき、CB1RやCB2Rを介した作用メカニズムがあるのではないかと考え調査を進めました。
エンドカンナビノイドシステムを介した作用機序仮説
調査の結果、CB2Rのアゴニストが創傷後のケラチノサイトの増殖と遊走を促進して再表皮化促進作用を示すという報告がありました。
マウスの背部の皮膚の全層切除を行って、創傷部位を評価していますが、PCNA陽性細胞がCB2Rアゴニスト投与群ではvehicle群と比較して上昇していることや、E-カドヘリン接着因子の低下、ビメンチンの上昇等、再表皮化促進作用が認められることが報告されています。
また、ヒト正常ケラチノサイトを培養しTPAとカルシウムで分化を誘導した場合、アナンダミドの濃度が低下しますが、そこにアナンダミドを追加することでケラチノサイトの分化が抑制されるという報告があります。
さらに、瘢痕形成においては、CB2Rのアゴニストを用いると創傷後の皮膚の肥厚を抑制することが報告されています。CB2Rアゴニスト処置群では、上皮や真皮組織の厚みがvehicle群と比較して低下しており、真皮中のコラーゲン線維が細いことが報告されています。
また、これまで報告されていたように、CB2Rアゴストは創傷部位の好中球やマクロファージを軽減させ、IL-6やIL-1β等の炎症性サイトカイン産生を低下させることで抗炎症作用を示すことも示されています。
FAAH阻害による作用機序仮説
以上の報告から、FAAH阻害剤はエンドカンナビノイドであるアナンダミドの分解を抑制することで皮膚組織中のエンドカンナビノイドの濃度を高め、CB1RやCB2Rのレセプターを介して再表皮化促進作用やケラチノサイト分化抑制作用、瘢痕形成抑制作用といった作用を示すことが期待されます。
そのため、表皮水疱症患者様において、FAAHの阻害剤は有効な治療薬となることが期待できると考えています。
弊社ではDrug Discovery Best Known Methodsの5つの解析ツールを用いて新規性の高い仮説を効率よく生成することが可能です。
その解析ツールのひとつである「二次元マッピング解析」は、自然言語処理AIのKIBITを活用して数百次元で表現されたベクトルを平面にプロットすることで、注目遺伝子と疾患・症状の関連性を可視化することが可能です。
そのことにより、思いもよらない遺伝子と疾患の関連性を俯瞰的・網羅的に探索することが可能となります。
今回は二次元マッピングについてご説明しましたが、その他の4つのツールも含め、弊社ではDrug Discovery Best Known Methodsに精通した研究者たちが新規性の高い標的分子や適用疾患の探索の支援を行わせて頂きます。
二次元マッピングには無限の可能性が秘められています。このマップに秘められた可能性をあなたならどう紐解くでしょうか?