G検定模擬試験set1 - 未解答
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングを含めて機械学習において精度の高い学習をするためには,観測データの適切な前処理が必須である.異なるスケールの特徴量を同時に扱えるようにするために,平均を 0 に分散を 1 に規格化する(ア)や,特徴量の線形結合からデータ内の分散が大きくなるような特徴量を得る(イ)などは広く利用されている.また,画像処理の分野においては,減算正規化と除算正規化の処理を行う(ウ)などが前処理として利用され,(エ)などの画像処理に特化したライブラリで行うことができる.また,自然言語処理の分野においては,文章に単語が含まれているかどうかを考えてテキストデータを数値化する(オ)や文章に含まれる単語の重要度を特徴量とする(カ)などがある.
人工知能の急激な進化により,様々なことが言われている.一つは,人工知能によって人類が危機にさらされるのではないかという議論である.2014 年のテレビインタビューにおいて「人工知能の進化は人類の終焉を意味する」と発言したのは以下の誰か.
(解説あり)(イ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングでの学習を効率的に行うにあたって,共有データセットの整備が徐々に進められている.しかしながら,現在広く普及しているものには,いくつかの問題点が指摘されている. 第一は, (ア) の問題である.現在は公正な利用がなされているとされているが,企業が共有データセットを利用して学習したモデルを自社のプロダクトに転用して売り上げを上げようとした場合に問題はないのかという議論が巻き起こっている.他の問題として,これは日本にとっての問題であるが,多くのデータセットが (イ) であることが挙げられる.これにより,日本固有の食べ物を認識しようとすると,それが全く別の国の食べ物としてのみ認識されるという不具合が生じるに至っている.
(ア)に最もよくあてはまる選択肢を 1 つ選べ.
生成モデル(generative model)とは,訓練データからそのデータの特徴を学習し,類似したデータを生成することができるモデルである.ディープニューラルネットの生成モデル(generative model)の例として,自己符号化器の潜在変数に確率分布を導入した(ア)や,訓練データと生成器が生成したデータを識別器で判別させることによって学習を進める(イ)がある.
(ア)に最もよくあてはまる選択肢を 1 つ選べ.
畳み込みニューラルネットワークの手法について扱う.(ア)は 1998 年に提案された,現在広く使われている CNN の元となるモデルであり,初めて多層 CNN に誤差逆伝播法を適用した手法である.2012 年に提案された(イ)は,画像認識のコンペティション ILSVRC で他手法に圧倒的な差をつけて優勝し,画像認識におけるディープラーニング活用の火付け役となった.しかし,一般に CNN は層を深くすると,パラメータ数が膨大となり学習が困難になってしまう傾向があった.層が深くなってもうまく学習を行うことができるモデルとして,ILSVRC2015 において多くの部門でトップの成績を収めた(ウ)がある.(ウ)は出力を入力と入力からの差分の和で表現したニューラルネットワークモデルである.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープニューラルネットワーク(DNN)の学習の目的は(ア)を最小化することであり,この最適化のために勾配降下法が利用される.しかし,勾配降下法にはパラメータの勾配を数値的に求めると(イ)問題があり,このような問題を避けるために誤差逆伝播法が利用される.またディープラーニングには過学習の問題もある.過学習とは(ウ)は小さいにも関わらず,(エ)が小さくならないことであり,これらの問題を克服するために様々な手法の開発が進められている.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
画像生成とは,何もない状態,もしくはある入力値に応じて目標の画像を生成する技術である.今最も利用されている画像生成手法は,GAN という生成敵対ネットワークである.特に,あるランダムな数値の入力値をもとに画像生成を行う DC(ア)やある文章から画像を生成する Attention(ア)などが有名である.このネットワークは(イ)と(ウ)から構成されており,(イ)は(エ)を騙すような画像を出力し,(ウ)は(イ)から出力された画像と本物の画像とを分類するようにそれぞれ学習する.このように学習することで,(イ)は適切な画像を出力することが可能となる.
(解説あり)(ア)に最もよくあてはまる選択肢を 1 つ選べ.
ディープニューラルネットワーク(DNN)の普及に貢献した一つの要素に,(ア)を克服する手法が提案されたことがある.(ア)は誤差逆伝播法において,(イ)ことによって生じるとされている.(ア)に対処するための方法として,あらかじめ良い重みの初期値を計算する(ウ)や,活性化関数に(エ)を利用する方法などがある.
(ウ)に当てはまらない選択肢を 1 つ選べ.
RNN は(ア)系列データの処理に長けているニューラルネットワークである.RNN は,(イ)勾配消失問題が起きやすいという特徴を持っていたが,RNN の一種である LSTM では(ウ)を含む LSTM Block を組み込むことで,長期間の系列情報に対しても勾配消失せずに学習を行うことができる.