FRONTEO | ライフサイエンスAI

”Amanogawa”

約1,600万の論文を数分で検索。創薬プロセスを抜本的に変革

創薬研究において、国内外の医薬研究の動向をタイムリーに追い続けるためには、論文や医学データを日常的に参照し疾病や化合物に関連する情報をアップデートし続けることが不可欠とされています。また、基礎研究から臨床試験に到達する確率は3,000~5,000分の1、研究期間は5~8年もの年月がかかると言われており、ひとつの成果を得るために費やす研究者の膨大な時間と労力が、創薬研究の大きな課題とされています。
そのような課題解決の一助となるべく開発された、論文探索AIシステム「Amanogawa」には、予めPubMed※1とOpen Targets※2の最新のデータベースを学習させており、AIエンジン「Concept Encoder」によってすべての論文情報を位置情報に変換することが可能です。研究者が同システムに自らの仮説やキーワードを入力すると、それらに関連する最新の論文が位置情報として地図状にプロットされ、参照すべき論文を視覚的に抽出できます。また、製薬企業がこれまでに保管してきた文書データを読み込ませて活用する、カスタマイズも可能です。
※1 PubMed:生物や医学の論文を検索できるデータベース。NLM(米国国立医学図書館)内にあるNCBI(国立生物科学情報センター)が作成。
※2 Open Targets:官民のパートナーシップによる創薬ターゲット発見のためデータベース

医薬品製造販売企業数 305社
※ 出典:厚生労働省「平成27年度医薬品・医療機器産業実態調査」

「Amanogawa」の機能

単語や文書同士の関連性・類似度をベクトルに変換
「Amanogawa」は、人工知能エンジン「Concept Encoder(conceptencoder®)」の特徴であるベクトル演算を用いることで、単語や文書同士の関連や類似度を数値化できるため、辞書では定義しにくい曖昧な概念も解析することができ、すべての単語を辞書登録する必要がないためデータベースの頻繁なアップデートが不要です。


抽出対象の指定も自由自在に行えるうえに省エネ設計
解析には、近似式を用いるため、解析やデータのアップデートの際のマシンパワーが軽く済むことも使いやすい点です。まるで検索ツールのように自然文を入力しつつ、例えば「ガンは除く」といったように、不要な要素を指定することで自在に引き去り、差分を抽出の対象とした解析できる、扱いやすさも特徴の1つです。

【「Amanogawa」の探索画面】

位置情報でプロットする機能のほか、ワードクラウド、発表年別分布など様々な角度から解析(左)。さらに、表示されたプロットの一部を選択し、一部のクラスタのみに絞り込んで論文を探索することも可能。
また、プロットされた論文情報は、検索した仮説との類似度の高いものから順に、カード形式でも表示され、アブストラクト(要旨)も参照可能(右)。

「Amanogawa」の特徴


1. MeSH(※1)タグ付きのPubMed論文1,400万と、Open Targetsのデータ170万を学習済みで、即時に探索・解析が可能。
2. 申し込みから最短で約1週間での利用開始が可能なクラウドサービス。
3. ベクトル演算によるAI解析を行うため、辞書不要。
4. 処理が軽いため、スーパーコンピュータや大規模サーバー群などの大型設備が不要。
5. 数千の論文解析をわずか1日で実現。

※1 MeSH:Medical Subject Headingsの略。PubMedの論文で医学を主題とした内容であることを表す。

Concept Encoderとは

Concept Encoder(コンセプトエンコーダー)は、FRONTEOライフサイエンスAI事業本部が開発した人工知能(AI)です。自由記述のテキストデータを大量に含むヘルスケア関連のビッグデータを、エビデンスに基づいて有効に解析・活用することができます。

CONTACT

お問い合わせ

お電話でのお問い合わせ

   03-5463-6330

株式会社FRONTEO ライフサイエンスAI事業本部

     CONTACT FORM