・ゲノミクスデータなどの多くのデータは非画像形式であり、隣り合う変数同士では明確な関係性が見られない場合が多くある。
・データ同士の関連を適切に考慮しつつ非画像データを画像データに変換できれば、畳み込みニューラルネットワーク(CNN)を使って特徴抽出・学習を行うことも可能となり、典型的な機械学習と比べた分類性能向上が期待できる。
・そこで上記を踏まえ、以下の3 ステップを持つ「DeepInsight(ディープインサイト)法」を開発。具体的には、以下のステップ1 で画素としての変数の配置をうまく行うための独自手法を適用している。
< DeepInsight(ディープインサイト)法>
- ステップ1:適切な変数(画素)の配置
- ステップ2:特徴抽出
- ステップ3:適切な分類モデルの構築
・この手法を、がん遺伝子発現などの実データに適用した結果、既存のランダムフォレスト法などの機械学習手法と比べて、高精度で分類できていることが確認された。
・遺伝子データなどさまざまな非画像データをディープラーニングで扱うことにより、背後にある複雑な特徴や構造を抽出し、医療での診断や医学・生命科学など広範囲の応用分野に貢献していくことが期待される。

出典:「G検定公式テキスト第2版」(翔泳社・2021年)より