G検定模擬試験set1 - 未解答
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
RNN は(ア)系列データの処理に長けているニューラルネットワークである.RNN は,(イ)勾配消失問題が起きやすいという特徴を持っていたが,RNN の一種である LSTM では(ウ)を含む LSTM Block を組み込むことで,長期間の系列情報に対しても勾配消失せずに学習を行うことができる.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
確率的勾配法はディープラーニングにおいて最もよく知られる最適化アルゴリズムであり,いくつかの改善を加えたものが広く使われている.例えば,以前に適用した勾配の方向を現在のパラメータ更新にも影響させる(ア)という手法や,勾配を 2 乗した値を蓄積し,すでに大きく更新されたパラメータほど更新量(学習率)を小さくする(イ)や,(イ)における一度更新量が飽和した重みはもう更新されないという欠点を,指数移動平均を蓄積することにより解決した(ウ)などがある.
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングの技術を利用したシステムを開発する際,複雑な処理が比較的簡潔に記述できることから,既存のフレームワークを利用することも多い.ディープラーニングのフレームワークは複数あり,google 社提供の(ア)や(ア)のラッパーとして機能する(イ),国内企業である PreferredNetworks 社で開発された(ウ)などがある.また,(エ)は(ウ)と同じ Define-by-Run 方式を採用している.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
線形モデルとは,(ア)を含む項の線形結合で,(ア)を含んだ数式の出力値は(イ)と呼ばれる.この線形結合で,特に(ア)も(イ)も一次元のデータの場合は,y = b0 + b1 * x と表される.こういったモデルを単回帰モデルと呼んだりもする.この数式において,各項の係数(例えば b0, b1)を(ウ)と呼び,このモデルを用いてテストデータを学習し,測定した実データを推定する.注意点として,(イ)が連続の値を取り扱う場合(エ)と呼ばれるが,離散の値を取り扱われる場合は(オ)と呼ばれ,それぞれ名称が異なる.ただ,実際のデータを扱うときに,(ア)が 1 次元であることはほとんどなく,2 次元以上になることが一般的である.このような場合,(ア)の次元数分だけ,係数パラメータを増やして,モデルを拡張する必要がある.このように(ア)が 2 つ以上の場合を(カ)モデルと呼び,各項の係数パラメータを(キ)という.またモデルによって出力された値と実際の測定値の誤差を(ク)という.この(ク)を用いて係数パラメータを推定する代表的なアルゴリズムに最小二乗法と最尤推定法がある.
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
ニューラルネットワークには様々なモデルがあり,タスクによって適切な選択をする必要がある.例えば,画像を扱う際には(ア),自然言語処理などの系列データには(イ)がよく使われる.他にも次元削減には(ウ),画像生成には(エ)などが用いられる.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
ニューラルネットワークには様々なモデルがあり,タスクによって適切な選択をする必要がある.例えば,画像を扱う際には(ア),自然言語処理などの系列データには(イ)がよく使われる.他にも次元削減には(ウ),画像生成には(エ)などが用いられる.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングを含めて機械学習において精度の高い学習をするためには,観測データの適切な前処理が必須である.異なるスケールの特徴量を同時に扱えるようにするために,平均を 0 に分散を 1 に規格化する(ア)や,特徴量の線形結合からデータ内の分散が大きくなるような特徴量を得る(イ)などは広く利用されている.また,画像処理の分野においては,減算正規化と除算正規化の処理を行う(ウ)などが前処理として利用され,(エ)などの画像処理に特化したライブラリで行うことができる.また,自然言語処理の分野においては,文章に単語が含まれているかどうかを考えてテキストデータを数値化する(オ)や文章に含まれる単語の重要度を特徴量とする(カ)などがある.