G検定模擬試験set1 - 未解答
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングの技術を利用したシステムを開発する際,複雑な処理が比較的簡潔に記述できることから,既存のフレームワークを利用することも多い.ディープラーニングのフレームワークは複数あり,google 社提供の(ア)や(ア)のラッパーとして機能する(イ),国内企業である PreferredNetworks 社で開発された(ウ)などがある.また,(エ)は(ウ)と同じ Define-by-Run 方式を採用している.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
自己符号化器はニューラルネットワークによる(ア)の代表的な応用であり,出力が入力に近づくようにニューラルネットを学習させる.主に(イ)のために利用されることが多く,活性化関数に恒等写像を用いた場合の 3 層の自己符号化器は(ウ)と同様の結果を返す.自己符号化器を多層化すると,ディープニューラルネット同様に勾配消失問題が生じるため,複雑な内部表現を得ることは困難であった.この問題に対して 2006 年頃に(エ)らは,単層の自己符号化器に分割し入力層から繰り返し学習させる(オ)を積層自己符号化器に適用することで,汎用的な自己符号化器の利用を可能とした.また,自己符号化器の代表的な応用例として(カ)がある.
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
正則化とは,機械学習の学習において汎化誤差をできるだけ小さくするための手法の総称である.ディープニューラルネットワーク(DNN)の学習で一般に用いられる正則化の手法に(ア)があり,誤差関数に重みの L2 ノルムを加えることで重みの発散を抑えることができる.また,L2 ノルムの代わりに L1 ノルムを用いる L1正則化は,(イ)の一種であり,重要でないパラメータを 0 に近づけることができる. L1 正則化を回帰に利用した場合,(ウ)と呼ばれる.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
生成モデル(generative model)とは,訓練データからそのデータの特徴を学習し,類似したデータを生成することができるモデルである.ディープニューラルネットの生成モデル(generative model)の例として,自己符号化器の潜在変数に確率分布を導入した(ア)や,訓練データと生成器が生成したデータを識別器で判別させることによって学習を進める(イ)がある.
(ア)に最もよくあてはまる選択肢を 1 つ選べ.
機械学習の手法は学習の枠組みに応じて主に三つに分類することができる. (ア)は入力とそれに対する出力のペアの集合を学習用データとする手法で,(イ)などが(ア)に含まれる.(ウ)は入力の集合だけから学習を行う手法であり,(エ)などが(ウ)に含まれる.最後に(オ)は,最終結果または連続した行動の結果に対して報酬を与え,報酬ができるだけ大きくなるような行動を探索する手法である.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
画像キャプションとは,ある画像からそこに写っているものの説明を生成する,画像処理と自然言語処理の融合分野である.キャプションは,対象となる画像を(ア)に入力し,そこから得られた特徴を(イ)に入力することで生成することが可能である.
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
強化学習では,行動を学習する(ア)と(ア)が行動を加える対象である(イ)を考え,行動に応じて(イ)は(ア)に状態と(ウ)を返す.行動と状態/(ウ)の獲得を繰り返し,最も多くの(ウ)をもらえるような方策を得ることが強化学習の目的である.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
畳み込みニューラルネットワークの(ア)のパラメータ数は(イ)と比較して極めて少ない.これは(ウ)によって(エ)ため,パラメータ数が減り,計算量が少なくなるためである.
(解説あり)(イ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングでの学習を効率的に行うにあたって,共有データセットの整備が徐々に進められている.しかしながら,現在広く普及しているものには,いくつかの問題点が指摘されている. 第一は, (ア) の問題である.現在は公正な利用がなされているとされているが,企業が共有データセットを利用して学習したモデルを自社のプロダクトに転用して売り上げを上げようとした場合に問題はないのかという議論が巻き起こっている.他の問題として,これは日本にとっての問題であるが,多くのデータセットが (イ) であることが挙げられる.これにより,日本固有の食べ物を認識しようとすると,それが全く別の国の食べ物としてのみ認識されるという不具合が生じるに至っている.