G検定模擬試験set1
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
画像キャプションとは,ある画像からそこに写っているものの説明を生成する,画像処理と自然言語処理の融合分野である.キャプションは,対象となる画像を(ア)に入力し,そこから得られた特徴を(イ)に入力することで生成することが可能である.
(ア)に最もよくあてはまる選択肢を 1 つ選べ.
画像生成とは,何もない状態,もしくはある入力値に応じて目標の画像を生成する技術である.今最も利用されている画像生成手法は,GAN という生成敵対ネットワークである.特に,あるランダムな数値の入力値をもとに画像生成を行う DC(ア)やある文章から画像を生成する Attention(ア)などが有名である.このネットワークは(イ)と(ウ)から構成されており,(イ)は(エ)を騙すような画像を出力し,(ウ)は(イ)から出力された画像と本物の画像とを分類するようにそれぞれ学習する.このように学習することで,(イ)は適切な画像を出力することが可能となる.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
画像生成とは,何もない状態,もしくはある入力値に応じて目標の画像を生成する技術である.今最も利用されている画像生成手法は,GAN という生成敵対ネットワークである.特に,あるランダムな数値の入力値をもとに画像生成を行う DC(ア)やある文章から画像を生成する Attention(ア)などが有名である.このネットワークは(イ)と(ウ)から構成されており,(イ)は(エ)を騙すような画像を出力し,(ウ)は(イ)から出力された画像と本物の画像とを分類するようにそれぞれ学習する.このように学習することで,(イ)は適切な画像を出力することが可能となる.
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
画像生成とは,何もない状態,もしくはある入力値に応じて目標の画像を生成する技術である.今最も利用されている画像生成手法は,GAN という生成敵対ネットワークである.特に,あるランダムな数値の入力値をもとに画像生成を行う DC(ア)やある文章から画像を生成する Attention(ア)などが有名である.このネットワークは(イ)と(ウ)から構成されており,(イ)は(エ)を騙すような画像を出力し,(ウ)は(イ)から出力された画像と本物の画像とを分類するようにそれぞれ学習する.このように学習することで,(イ)は適切な画像を出力することが可能となる.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
画像生成とは,何もない状態,もしくはある入力値に応じて目標の画像を生成する技術である.今最も利用されている画像生成手法は,GAN という生成敵対ネットワークである.特に,あるランダムな数値の入力値をもとに画像生成を行う DC(ア)やある文章から画像を生成する Attention(ア)などが有名である.このネットワークは(イ)と(ウ)から構成されており,(イ)は(エ)を騙すような画像を出力し,(ウ)は(イ)から出力された画像と本物の画像とを分類するようにそれぞれ学習する.このように学習することで,(イ)は適切な画像を出力することが可能となる.
(解説あり)(ア)に最もよくあてはまる選択肢を 1 つ選べ.
従来は,現在のディープラーニングのように入力から出力までの処理を一括で行うことができない情報を扱うことがあった.そうした場合,まず用意したデータをある手法を用いて加工し,それが入力値となり,別の手法を用いて処理を行いといった,ステップバイステップの学習が必要だった.しかし,ディープラーニングの登場によって,処理を複数回に分けて行う必要がなくなったこのような,ディープラーニングにおいて重要な方法論のことを(ア)と呼ぶ.
(ア)に最もよくあてはまる選択肢を 1 つ選べ.
1990 年代の音声認識は(ア)による,音自体を判別するための音響モデルと,(イ)による語と語のつながりを判別する言語モデルの両方でできている.しかし,ディープラーニングの登場,とりわけ(ウ)の登場により,音響特徴量から音素,文字列,更には単語列に直接変換する End to End モデルというアプローチを取ることが可能になり,人的に前処理を行わなくても解析することが可能となった.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
1990 年代の音声認識は(ア)による,音自体を判別するための音響モデルと,(イ)による語と語のつながりを判別する言語モデルの両方でできている.しかし,ディープラーニングの登場,とりわけ(ウ)の登場により,音響特徴量から音素,文字列,更には単語列に直接変換する End to End モデルというアプローチを取ることが可能になり,人的に前処理を行わなくても解析することが可能となった.
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
1990 年代の音声認識は(ア)による,音自体を判別するための音響モデルと,(イ)による語と語のつながりを判別する言語モデルの両方でできている.しかし,ディープラーニングの登場,とりわけ(ウ)の登場により,音響特徴量から音素,文字列,更には単語列に直接変換する End to End モデルというアプローチを取ることが可能になり,人的に前処理を行わなくても解析することが可能となった.
(ア)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングはソフトウェアフレームワークを利用して実装するのが一般的である.多層のニューラルネットワークモデルを定義し,データを用いて学習・予測を実行するのがフレームワークの役割だが,重要なのはネットワークの記述方法とその柔軟性である.ネットワークには大きく分けて 二つの記述方法がある.一つ目は(ア)による記述方法である.これらの記述方法を採用しているソフトウェアには(イ)があげられる.この方法を用いることによって,モデルの定義がテキストで設定でき,簡単に学習を開始させることが出来るというメリットがある.一方で,ループ構造をもつような RNN など,複雑なモデルを扱う際には,モデルの定義を記述することは難しくなる傾向にある.二つ目は(ウ)による記述方法である.代表的なフレームワークとして(エ)があげられる.一度書き方を覚えてしまえば,複雑なモデルでも比較的簡単に記述することが出来るが,モデルは,それぞれのフレームワーク固有のソースコードで出来上がるため,モデルが使用しているソフトウェアに依存してしまうという問題がある.