膨大な論文情報を即時検索・分析。創薬プロセスを抜本的に変革

製薬企業の医薬品研究開発部門では、創薬研究において、論文情報と公開データベースを日々チェックし、重要な情報について常に知識・知見をアップデートすることが不可欠です。一方で、年々増え続ける膨大な情報をタイムリーに捕捉するための情報収集作業に、研究者は多大な時間と労力を費やしています。また、基礎研究から臨床試験に到達する確率は3,000~5,000分の1、研究期間は5~8年もの年月がかかると言われており、1つの成果を得るために費やす膨大な時間と労力が、創薬研究の大きな課題となっています。
FRONTEOが開発した論文探索AIシステム「KIBIT Amanogawa」は、独自のAIエンジン「KIBIT」によって、PubMed*1に掲載された膨大な論文情報から検索したい情報を一瞬にして抽出・分類し、位置情報として表示します。調べたい単語や文章、仮説を入力すると、それらに関連する論文が位置情報としてマップ状にプロットされるため、論文情報を視覚的かつ網羅的に把握できます。また、各製薬企業がこれまでに蓄積してきたデータを読み込ませることで、各企業独自のマップのカスタマイズも可能であり、拡張性の高いソフトウェアとなっています。(特許登録番号:特許第6976537号)
*1 PubMed:生物医学領域の論文を検索できるデータベース。米国国立医学図書館の国立生物科学情報センターが作成。

「KIBIT Amanogawa」の機能

単語や文書同士の関連性・類似度をベクトルに変換

「KIBIT Amanogawa」は、人工知能エンジン「KIBIT」の特徴であるベクトル演算を用いて、単語や文書同士の関連や類似度を数値化します。辞書では定義しにくい曖昧な概念も解析できます。また、検索したい情報に関連するすべての単語を辞書登録する必要がないため、データベースの頻繁なアップデートが不要です。

抽出対象の自由自在な指定が可能な上に省エネ設計

解析には近似式を用いるため、解析やデータのアップデートの際のマシンパワーが軽く済むことも使いやすい点です。検索ツールのように自然文を入力しつつ、例えば「ガンは除く」といったように不要な要素を自在に指定して引き去り、差分を抽出の対象とする解析ができるなどの扱いやすさも特徴の1つです。


「KIBIT Amanogawa」の検索画面

論文を位置情報でプロットし、「Space Map」に表示。マップの一部を選択し、その部分のクラスタのみを対象に絞り込んだ探索や、システム画面上でのアブストラクト(要旨)の参照も可能です。データベースの論文は2週間ごとにアップデートされ、新着論文フィルタリング機能により、新たな文献の発表状況・内容の確実なキャッチアップをサポートします。
検索結果は、さらに各クラスタがどのような内容かを示す「Terms Frequency」、各クラスタの年次推移を示し論文内容のトレンドを一目で把握できる「Chronological Chart」などにより、様々な角度から分析可能です。「Word Cloud」は冠詞などの一般語を排除し、分子名や疾患名、医学用語など、研究上の意味を持つ単語のみで構成。一般語のノイズなしに、必要な情報を視覚化します。「Card Box」では、プロットされた論文情報を検索ワードや仮説との関連性・類似度の高いものから順に表示するほか、上位100報*2の論文のリストのExcel形式での出力が可能です。各パネルの表示サイズ・位置は、ユーザーが自身の好みや目的に合わせて自由にカスタマイズできます。
*2 キーワード検索結果、ベクトル検索結果、キーワード/ベクトルのハイブリッド検索結果、ベクトル検索結果からキーワード検索結果との重複分を除いたディスカバリ検索結果に基づく各100報、計400報

「KIBIT Amanogawa」の特徴

1. PubMedに掲載された全英語論文を学習済みで、即時の探索・解析が可能。
2. 申し込みから最短で約1週間での利用開始できるクラウドサービス。
3. ベクトル演算によるAI解析を行うため、辞書が不要。
4. 処理が軽いため、スーパーコンピュータや大規模サーバー群などの大型設備が不要。

KIBIT Amanogawaシステム導入のお申し込みはこちら

ライフサイエンスAI事業本部へのお問い合わせ