仮説生成のための発見型概念検索AIシステム
● 創薬研究者が仮説生成のために開発したAIシステム
● 分布仮説*1に基づいたアルゴリズムで、類似性・関連性の高い論文を抽出
● 仮想的に概念を足し引きし、新たな着想を得る
FRONTEO独自の自然言語処理 AI技術を用いた論文探索AIシステムです。単語や文章、仮説を入力すると、AIが PubMed*2に掲載されている膨大な論文情報から、類似性・関連性の高い論文情報を即時検出・解析します。人の作業では膨大な時間を要していた作業が大幅に効率化されることに加え、従来のキーワード検索では発見できなかった情報や、検索者によるバイアスの掛からない情報を見つけることが可能となり、医学・創薬研究における客観的・網羅的な分析を実現します。企業・機関が独自に保有するデータを読み込ませるなどのカスタマイズにも対応する、拡張性の高いアプリケーションです。(特許登録番号:特許第6976537号)
*1 自然言語処理における、単語はその周りの単語で特徴づけられるという考え方(Harris Z., 1954, Distributional Structure, WORD, 10:2-3, 146-162.)
*2 米国国立医学図書館の国立生物科学情報センターが運営する生物医学領域の論文データベース。https://pubmed.ncbi.nlm.nih.gov
「KIBIT Amanogawa」の特徴
■ アンバイアス(Unbiasedness):膨大な数の論文を客観的・網羅的に解析
膨大な論文情報を、研究者の知識・関心や掲載ジャーナルなどの影響を受けることなく、AIが客観的・網羅的に解析。単語や文章を関連性・類似度に基づいてベクトル(数値)に変換し、位置情報として提示するため、結果を一目で把握できます。
■ セレンディピティ(Serendipity):予想外の発見に出会う確率を上げる
ベクトル変換技術により、キーワード検索では見つけられなかった予想外の情報や文献も検出。「ガンは除く」など不要な要素を除外した検索も可能なため、他領域や未知の情報へのアクセスも効率的に行えます。
■ ディスカバリ(Discovery):新たな着想を得る
KIBIT Amanogawaでの発見や気づきから新たな着想を得て、研究の進展やさらなる探索につなげることができます。
● PubMedに掲載された全英語論文を学習済みで、即時の探索・解析が可能
● 申し込みから最短で約1週間での利用開始できるクラウドサービス
● 処理が軽いため、スーパーコンピュータや大規模サーバー群などの大型設備が不要
「KIBIT Amanogawa」の機能
論文を位置情報でプロットし、「Space Map」に表示。マップの一部を選択し、その部分のクラスタのみを対象に絞り込んだ探索や、システム画面上でのアブストラクト(要旨)の参照も可能です。データベースの論文は2週間ごとにアップデートされ、新着論文フィルタリング機能により、新たな文献の発表状況・内容の確実なキャッチアップをサポートします。
検索結果は、さらに各クラスタがどのような内容かを示す「Terms Frequency」、各クラスタの年次推移を示し論文内容のトレンドを一目で把握できる「Chronological Chart」などにより、様々な角度から分析可能です。「Word Cloud」は冠詞などの一般語を排除し、分子名や疾患名、医学用語など、研究上の意味を持つ単語のみで構成。一般語のノイズなしに、必要な情報を視覚化します。「Card Box」では、プロットされた論文情報を検索ワードや仮説との関連性・類似度の高いものから順に表示するほか、上位100報*3の論文のリストのExcel形式での出力が可能です。各パネルの表示サイズ・位置は、ユーザーが自身の好みや目的に合わせて自由にカスタマイズできます。「Concept Similarity」では、疾患や遺伝子名を入力すると、関連性(コサイン類似度)の高い疾患・遺伝子を確認することが可能です。
*3 キーワード検索結果、ベクトル検索結果、キーワード/ベクトルのハイブリッド検索結果、ベクトル検索結果からキーワード検索結果との重複分を除いたディスカバリ検索結果に基づく各100報、計400報
ライフサイエンスAI事業本部へのお問い合わせ