27,424解答

G検定模擬試験set1 - 未解答

    (ア)に最もよくあてはまる選択肢を 1 つ選べ.

    画像キャプションとは,ある画像からそこに写っているものの説明を生成する,画像処理と自然言語処理の融合分野である.キャプションは,対象となる画像を(ア)に入力し,そこから得られた特徴を(イ)に入力することで生成することが可能である.

    (ア)に最もよくあてはまる選択肢を 1 つ選べ.

    ディープラーニングはソフトウェアフレームワークを利用して実装するのが一般的である.多層のニューラルネットワークモデルを定義し,データを用いて学習・予測を実行するのがフレームワークの役割だが,重要なのはネットワークの記述方法とその柔軟性である.ネットワークには大きく分けて 二つの記述方法がある.一つ目は(ア)による記述方法である.これらの記述方法を採用しているソフトウェアには(イ)があげられる.この方法を用いることによって,モデルの定義がテキストで設定でき,簡単に学習を開始させることが出来るというメリットがある.一方で,ループ構造をもつような RNN など,複雑なモデルを扱う際には,モデルの定義を記述することは難しくなる傾向にある.二つ目は(ウ)による記述方法である.代表的なフレームワークとして(エ)があげられる.一度書き方を覚えてしまえば,複雑なモデルでも比較的簡単に記述することが出来るが,モデルは,それぞれのフレームワーク固有のソースコードで出来上がるため,モデルが使用しているソフトウェアに依存してしまうという問題がある.

    (解説あり)(ア)に最もよくあてはまる選択肢を 1 つ選べ.

    機械学習においては過学習を避けるために,訓練誤差ではなく汎化誤差を可能なかぎり小さくする手法である(ア)を用いることが多い.また複数のモデルの予測結果の平均を利用する(イ)がある.他にもディープニューラルネットワーク(DNN)に対しては,ランダムに一定の割合のノードを削除して学習を行う(ウ)が有効とされている.(ア)手法にはいくつかのパラメータをスパースにする(エ)などがある.

    (ウ)に最もよくあてはまる選択肢を 1 つ選べ.

    ディープラーニングの技術を利用したシステムを開発する際,複雑な処理が比較的簡潔に記述できることから,既存のフレームワークを利用することも多い.ディープラーニングのフレームワークは複数あり,google 社提供の(ア)や(ア)のラッパーとして機能する(イ),国内企業である PreferredNetworks 社で開発された(ウ)などがある.また,(エ)は(ウ)と同じ Define-by-Run 方式を採用している.

    (カ)に最もよくあてはまる選択肢を 1 つ選べ.

    ディープラーニングを含めて機械学習において精度の高い学習をするためには,観測データの適切な前処理が必須である.異なるスケールの特徴量を同時に扱えるようにするために,平均を 0 に分散を 1 に規格化する(ア)や,特徴量の線形結合からデータ内の分散が大きくなるような特徴量を得る(イ)などは広く利用されている.また,画像処理の分野においては,減算正規化と除算正規化の処理を行う(ウ)などが前処理として利用され,(エ)などの画像処理に特化したライブラリで行うことができる.また,自然言語処理の分野においては,文章に単語が含まれているかどうかを考えてテキストデータを数値化する(オ)や文章に含まれる単語の重要度を特徴量とする(カ)などがある.

    (ウ)に最もよくあてはまる選択肢を 1 つ選べ.

    現在,人工知能研究は抽象概念や知識理解に辿り着くために大きく分けて三つの路線を辿っている.この三つの路線は,とりわけある企業や大学によって研究が進められている. ・言語データによる RNN や映像データからの概念・知識理解を目指す(ア)路線 ・実世界を対象に研究を進め,知識理解を目指す(イ)路線 ・オンライン空間上でできることをターゲットにするして,知識理解を目指す(ウ)路線

    (解説あり)(イ)に最もよくあてはまる選択肢を 1 つ選べ.

    ディープラーニングでの学習を効率的に行うにあたって,共有データセットの整備が徐々に進められている.しかしながら,現在広く普及しているものには,いくつかの問題点が指摘されている. 第一は, (ア) の問題である.現在は公正な利用がなされているとされているが,企業が共有データセットを利用して学習したモデルを自社のプロダクトに転用して売り上げを上げようとした場合に問題はないのかという議論が巻き起こっている.他の問題として,これは日本にとっての問題であるが,多くのデータセットが (イ) であることが挙げられる.これにより,日本固有の食べ物を認識しようとすると,それが全く別の国の食べ物としてのみ認識されるという不具合が生じるに至っている.

    (エ)に最もよくあてはまる選択肢を 1 つ選べ.

    ディープニューラルネットワーク(DNN)の学習の目的は(ア)を最小化することであり,この最適化のために勾配降下法が利用される.しかし,勾配降下法にはパラメータの勾配を数値的に求めると(イ)問題があり,このような問題を避けるために誤差逆伝播法が利用される.またディープラーニングには過学習の問題もある.過学習とは(ウ)は小さいにも関わらず,(エ)が小さくならないことであり,これらの問題を克服するために様々な手法の開発が進められている.

    (エ)に最もよくあてはまる選択肢を 1 つ選べ.

    線形モデルとは,(ア)を含む項の線形結合で,(ア)を含んだ数式の出力値は(イ)と呼ばれる.この線形結合で,特に(ア)も(イ)も一次元のデータの場合は,y = b0 + b1 * x と表される.こういったモデルを単回帰モデルと呼んだりもする.この数式において,各項の係数(例えば b0, b1)を(ウ)と呼び,このモデルを用いてテストデータを学習し,測定した実データを推定する.注意点として,(イ)が連続の値を取り扱う場合(エ)と呼ばれるが,離散の値を取り扱われる場合は(オ)と呼ばれ,それぞれ名称が異なる.ただ,実際のデータを扱うときに,(ア)が 1 次元であることはほとんどなく,2 次元以上になることが一般的である.このような場合,(ア)の次元数分だけ,係数パラメータを増やして,モデルを拡張する必要がある.このように(ア)が 2 つ以上の場合を(カ)モデルと呼び,各項の係数パラメータを(キ)という.またモデルによって出力された値と実際の測定値の誤差を(ク)という.この(ク)を用いて係数パラメータを推定する代表的なアルゴリズムに最小二乗法と最尤推定法がある.

    (エ)に最もよくあてはまる選択肢を 1 つ選べ.

    畳み込みニューラルネットワークの(ア)のパラメータ数は(イ)と比較して極めて少ない.これは(ウ)によって(エ)ため,パラメータ数が減り,計算量が少なくなるためである.

loading!!

loading
続きを表示する
再読み込み

ログイン / 新規登録

 

アプリをダウンロード!
DiQt

DiQt(ディクト)

無料

★★★★★★★★★★