G検定の例題

人工知能をめぐる動向

以下の文章を読み、空欄に最もよく当てはまる選択肢をそれぞれ1つずつ選べ。 

第一次AIブームは1950年台に起こった。この頃に人工知能と呼ばれたプログラムは(ア)をもとに問題を解いていた。特に、1996年にIBMが開発した(イ)は、チェスの世界チャンピオンであるガルリ・カスパロフに勝利したことで有名である。しかし、ルールや設定が決まりきった迷路やパズルゲームなどの(ウ)と呼ばれる問題しか解けないという課題があったために、研究は下火になった。

(ア)
1. 知識表現
2. 表現学習
3. 機械学習
4. 探索・推論

(イ)
1. Deep Blue
2. Bonkras
3. Ponanza
4. Sharp

(ウ)
1. A/Bテスト
2. パターンマッチング
3. トイ・プロブレム
4. ダートマスワークショップ

国際的な画像認識コンペティション“ILSVRC2012”について、正しいものをすべて選べ。

1. 画像認識は、2017年現在でディープラーニングが最も高い精度を実現できるタスクである。
2. ImageNetとは、手書き文字認識のためのデータセットである。
3. 優勝チームはトロント大学のジェフリー・ヒントン教授率いるSuperVisionである。
4. このコンペティションであげられた成果は、「人工知能研究50年来のブレイク・スルー」と称された。

人工知能分野の問題

以下に挙げる用語は、第二次AIブームが起こった際に取り上げられた問題である。それぞれの問題の説明としてふさわしいものをそれぞれ1つずつ選びなさい。

(ア)フレーム問題
(イ)シンボルグラウンディング問題

1. 人間の持つ膨大な知識を体系化することが難しい。
2. 膨大な情報のうちから、必要なものだけを選んで考慮することが難しい。
3. 単語などの記号と、それの表す意味を結びつけることが難しい。
4. 膨大な知識を処理するための計算機の開発が難しい。
5. 十分なデータを取るためのインターネットを整備することが難しい。

 「強いAI・弱いAI」に関する説明として適切なものを2つ選べ。

1. 「強いAI」は、エキスパートシステムと呼ばれ、現在でも広く実用されている。
2. AGI(Artificial General Intelligence: 汎用人工知能)と呼ばれるものは、「強いAI」により近いものである。
3. 本来の意味での「人間のように考えるコンピュータ」が開発されたことが、第3次人工知能ブームのきっかけである。
4. 国際的な画像認識のコンペティションでは、「弱いAI」が人間を超える識別性能を実現している。

機械学習の具体的手法

以下の文章は、さまざまな機械学習の手法について述べたものである。空欄に最もよく当てはまる選択肢を、語群の中から1つずつ選べ。

機械学習にはいくつかの手法があり、用語の意味を正しく理解する必要がある。学習データに教師データと呼ばれる正解ラベルつきのデータを用いる手法は(ア)と呼ばれ、対照的に正解ラベルがないデータを利用する手法は(イ)と呼ばれる。また、正解ラベルが一部のサンプルにのみ与えられている(ウ)という手法も存在する。

1. 教師なし学習
2. 教師あり学習
3. 強化学習
4. 表現学習
5. マルチタスク学習
6. 半教師あり学習
7. 多様体学習

以下の空欄に最もよく当てはまる選択肢を、語群の中から1つずつ選べ。

分類問題にはさまざまな性能指標がある。ここでは、サンプルを陽性(Positive)と陰性(Negative)の2クラスに分ける2値分類を考える。(ア)は単純にサンプル全体のうち、予測が正解したサンプル数の比を取ったものである。また、偽陽性(False Positive, FP)を減らすことに特に注力したい場合には(イ)を、逆に偽陰性(False Negative, FN)を減らすことに特に注力する場合には(ウ)を採用することが望ましい。しかし、この両者はトレードオフの関係にあることから、それらの調和平均を取った(エ)が利用されることも多い。

1. 正答率
2. 実現率
3. 協調率
4. 調和率
5. 適合率
6. 再現率
7. f値
8. p値
9. t値
10. z値

機械学習では、教師データをいくつかに分割して、そのうち一部だけを学習に利用するのが原則である。逆に言えば、その他の教師データはあえてモデルの学習に利用せずに、残しておく。そのような手法を採用する目的として、最も適切なものを1つ選べ。

1. いったん少ないデータ量で学習させ、初期段階の計算資源を節約するため。
2. データの中に含まれる異常値を持つサンプルを取り除くため。
3. 半教師あり学習はデータの一部がラベル付けされていなくても行えるため。
4. モデルが運用される際に示す性能を正しく見積もるため。

空欄に当てはまる語句の組み合わせとして最も適しているものを1つ選べ。

教師あり学習の問題は出力値の種類によって、大きく2種類に分けられる。(A) 問題は出力が離散値であり、カテゴリーを予測したいときに利用される。一方、(B) 問題は出力が連続値であり、その連続値そのものを予測したいときに利用される。

1. (A) 限定 (B) 一般
2. (A) 部分 (B) 完全
3. (A) 分類 (B) 回帰
4. (A) 線形 (B) 非線形

ディープラーニングの概要

近年急速にディープラーニングが高い成果を上げるようになった理由として当てはまるものを全て選べ。

1. 半導体技術の進歩による計算機の性能向上やGPUによる高速な並列演算により、現実的な時間で学習を行うことができるようになったため。
2. 神経科学の発展により、画像認識や自然言語処理に対する視覚野や言語野など、タスクに対応した人間の脳の構造を実物通りに再現できるようになったため。
3. インターネットの普及により、表現力の高いモデルが過学習を起こさずにすむ大量のデータを得ることができるようになったため。
4. 誤差逆伝播法の発明によってそれまで困難だった多層ニューラルネットワークの訓練が可能になったため。
5. ディープラーニング向けのフレームワークが多数開発され、実装が容易になったため。

以下の文章を読み、空欄に最もよく当てはまる選択肢を1つずつ選びなさい。

従来の機械学習で利用されていた最適化手法である最急降下法は、一度の学習にすべてのデータを利用することから(ア)と呼ばれている。しかし、ディープラーニングの場合データが大規模であることからそれが難しい。よって、確率的勾配降下法という手法が用いられることも多い。ひとつのサンプルだけを利用する手法は(イ)と呼ばれる。(ア)と(イ)は、どちらにも長所と短所があり、一定数のサンプル群を利用する(ウ)が採用されることが推奨される。

1. セット学習
2. バッチ学習
3. オンライン学習
4. ポイント学習
5. サンプリング学習
6. ミニバッチ学習

あるニューラルネットワークのモデルを学習させた際、テストデータに対する誤差を観測していた。そのとき、学習回数が100を超えるまでは誤差が順調に下がり続けていたが、それ以降は誤差が徐々に増えるようになってしまった。その理由として最も適切なものを1つ選べ。

1. 学習回数が増えるほど、誤差関数の値が更新されにくくなるため。
2. 学習回数が増えるほど、学習データにのみ最適化されるようになってしまうため。
3. 学習回数が増えるほど、一度に更新しなければならないパラメータの数が増えていくため。
4. 学習回数が増えるほど、計算処理にかかる時間が増えてしまうため。

ディープラーニングの手法

以下の文章を読み、空欄に最もよく当てはまる選択肢を語群の中から1つずつ選べ。

画像認識の国際的なコンペティションのひとつに、ILSVRC(ImageNet Large Scale Visual Recognition Competition)がある。ここで、2012年にCNNのモデルである(ア)が優勝を飾った。それからというもの、続けざまにCNNのモデルが高い成果を上げている。2014年にはインセプションモジュールという構造を利用した(イ)が優勝し、(ウ)もまたそれに迫る優秀な功績を収めた。また、2015年には残差学習という深いネットワークの学習を可能にした(エ)がそれぞれ優勝している。

1. AlexNet
2. ElmanNet
3. GoogLeNet
4. ImageNet
5. LeNet
6. ResNet
7. VGG
8. WaveNet

以下の文章を読み、空欄に最もよく当てはまる選択肢を各語群の中から1つずつ選べ。

ニューラルネットワークにおいて、初期は中間層で(ア)が活性化関数として使用されていた。しかし、(イ)ために、層を深くすると学習に用いる勾配がほぼ0になってしまうという問題が起こった。これは、勾配消失問題と呼ばれる重要な問題である。
ディープラーニングで活性化関数として用いられることが多い(ウ)は(ア)と比較してこの問題が生じにくい。また、計算量が少なく済むことも特徴的である。一方で、(エ)を用いることで活性化関数として(ア)を用いた場合でも学習が早く進むことが知られている。

(ア)
1. ステップ関数
2. ReLU
3. sigmoid関数
4. softmax関数

(イ)
1. 負の値を入力された場合に出力が一定になってしまう
2. 出力の平均値が0、標準偏差が1にならない
3. 関数に微分不可能な点が存在する
4. 入力の絶対値が大きいと、出力がほぼ一定になってしまう

(ウ)
1. ステップ関数
2. ReLU
3. sigmoid関数
4. softmax関数

(エ)
1. Dropout
2. Batch Normalization
3. Regularization
4. Weight Decay

次の文章の(A)、(B)の組み合わせとして、最も適しているものを1つ選べ。

時系列データの分析には、もともと( A )が最も適していると考えられていたが、時系列データのひとつである音声処理の分野では( B )が非常に高い精度を記録している。

1. (A)リカレントニューラルネットワーク (B)畳み込みニューラルネットワーク
2. (A)リカレントニューラルネットワーク (B)Autoencoder
3. (A)畳み込みニューラルネットワーク (B)リカレントニューラルネットワーク
4. (A)畳み込みニューラルネットワーク (B)Autoencoder
5. (A)Autoencoder (B)畳み込みニューラルネットワーク
6. (A)Autoencoder (B)リカレントニューラルネットワーク

以下の文章の空欄に最も適切に当てはまる選択肢を、各語群の中からそれぞれひとつずつ選べ。

RNN(Recurrent Neural Network)は、(ア)を扱うために開発された。それまでのフィードフォワードニューラルネットワークと比較して特徴的なのは、入力データに加え(イ)を隠れ層に入力する(ウ)構造を取り入れたことである。

(ア)
1. 周期データ
2. 累積データ
3. 連鎖データ
4. 系列データ

(イ)
1. 前回の入力
2. 前回の中間層の状態
3. 過去のすべての入力
4. 過去のすべての中間層の状態

(ウ)
1. 再帰
2. 畳み込み
3. 逆伝播
4. 正則化

通常のニューラルネットワークにはない、畳み込みニューラルネットワークがもつ分類問題の汎化性能の向上に寄与する特徴として、最も適切なものを1つ選べ。

1. ネットワークの中間層で、再帰的にフィードバックが与えられる。
2. 決定境界を非線形にするために、活性化関数が利用される。
3. 画像全体に対して、一定範囲ごとに入力の特徴量が抽出される。
4. 出力層において、出力が確率に変換される。

ディープラーニングの研究分野

以下の文章の空欄に最もよく当てはまるものを1つずつ選べ。

ロボティクス分野でも、機械学習の応用が進められている。例えば、ロボットの動作制御にQ学習やモンテカルロ法などの(ア)のアルゴリズムを利用する事例は多く存在する。また、ロボットはカメラ(視覚)、マイク(聴覚)、圧力センサ(触覚)などの異なったセンサ情報を収集できる(イ)システムを持っていることから、これらの情報をDNNで統合的に処理する研究や、ロボットの一連の動作の生成をひとつのDNNで実現しようとする(ウ)の研究も行われている。

(ア)
1. End to End Learning
2. Supervised Learning
3. Motion Learning
4. Adaptive Learning
5. Reinforcement Learning
6. Representation Learning

(イ)
1. マルチモーダル
2. インセプション
3. コグニティブ
4. フルスクラッチ

(ウ)
1. End to End Learning
2. Supervised Learning
3. Motion Learning
4. Adaptive Learning
5. Reinforcement Learning
6. Representation Learning

RNN(Recurrent Neural Network)が自然言語処理の分野で精度の向上に寄与した理由として、最も適しているものを1つ選べ。

1. 畳み込み層で畳み込み処理を行うことにより、単語の出現位置から文脈を読み取れるようになったため。
2. 隠れ層で過去の情報を保持できるようになり、文字の並びから意味を抽出できるようになったため。
3. ネットワークの外部に記憶部分を設けることで、文章のパターンを簡単に参照できるようになったため。
4. 正しい文章の出力ができるようになるまで繰り返し自動で学習できるようになったため。