「PubMedでヒットしない遺伝子」を探し出す
PubMed*13000万報以上の論文から疾患との関連が予測される遺伝子を一瞬で抽出し、
治療効果の期待できる標的遺伝子の発見を可能にするFRONTEOの自社開発AIエンジン「KIBIT(キビット)」。
独自の解析手法により、関連性のある遺伝子の中から、PubMedで検索してもヒットしない、
もしくは数報のみの、新規性の高い標的遺伝子を提示します。
*1 米国国立医学図書館の国立生物科学情報センターが運営する生物医学領域の論文データベース。
https://pubmed.ncbi.nlm.nih.gov/
「PubMedでヒットしない遺伝子」を探し出せる理由
KIBITは、分布仮説*2に基づく単語や文章のベクトル化(数値化)を強みとしています(日米で特許取得)。論文に直接記載された例がなくても、ある疾患に関連する遺伝子と似た機能や位置づけの遺伝子を見つけ、研究者が推察するのと同じように疾患との関連性を予測します。
*2 自然言語処理における、単語はその周りの単語で特徴づけられるという考え方(Harris Z., 1954, Distributional Structure, WORD, 10:2-3, 146-162. Firth J. R., 1957, A synopsis of linguistic theory 1930-1955, Studies in Linguistic Analysis, Philological Society, 1-32., Selected Papers of J.R. Firth 1952-1959, 1968.)
「創薬可能性の高い遺伝子」かつ
「PubMedでヒットしない遺伝子」を抽出
疾患との関連があるとされる遺伝子には、発症の原因となる原因性遺伝子と、
発症によって影響を受ける応答性遺伝子があります。
KIBITは、論文情報を基に、遺伝子の関連性と原因性・応答性を予測します。
疾患との関連性が高く、同時に原因性の高い遺伝子は、治療効果の期待できる高い標的遺伝子だと言えます。
この中には、PubMedで検索しても、現時点では記載された論文がヒットしない、
もしくは数報しかヒットしない標的遺伝子が含まれています。
FRONTEOのAIの活用により、未だ創薬研究者に知られていない、
また通常のアプローチでは気づくことの困難な新規性の高い標的遺伝子を発見することができます。
Gene Symbol | 関連性 | 原因性 | PubMed counts |
AAA | 0.29 | 0.78 | 92 |
BBB | 0.44 | 0.35 | 381 |
CCC | 0.14 | 0.88 | 22 |
DDD | 0.25 | 0.49 | 77 |
EEE | 0.5 | 0.05 | 35273 |
FFF | 0.24 | 0.98 | 36 |
GGG | 0.48 | 0.73 | 2582 |
HHH | 0.11 | 0.99 | 1 |
JJJ | 0.6 | 0.81 | 12807 |
疾患の遺伝子ネットワークとは何か?
KIBITは、PubMedに収載されている3000万報以上の論文から疾患とのつながりを予測し、標的遺伝子と、それらの原因性・応答性などの位置づけを短時間で提示。
独自のインタラクトーム解析技術によって、疾患の原因性遺伝子と応答性遺伝子、またそれらにつながりのある遺伝子について、生体内遺伝子間の相互作用の網羅的なネットワークを描きます。
このネットワークを俯瞰し、注目することで、創薬研究における新たな発見を導きます。
About KIBIT
仮説生成のための
発見型概念検索AIシステム
KIBIT Amanogawaは、KIBITを搭載した論文探索AIシステムです。独自の特許技術を用いた概念検索*3により、創薬プロセスにつながる情報や新たなヒントの効率的な発見を支援します。
単語や文章、仮説を入力すると、PubMedに掲載されている膨大な論文情報から、類似性・関連性の高い論文情報を即時検出・解析。結果は位置情報に基づくマップやグラフを含む多様な形で表示されるため、視覚的・直観的かつ網羅的な把握が可能です。
*3 自然言語処理において、情報を内容の類似性・関連性に基づき検索する手法。特定の文字列やキーワードを含まない情報、表記ゆれや特殊用語を含む情報でも検出することができる。
- 創薬研究者が仮説生成のために開発したAIシステム
- 分布仮説に基づいたアルゴリズムで、類似性・関連性の高い論文を抽出
- 仮想的に概念を足し引きし、新たな着想を得る