最終更新日:2023/07/13

(ウ)に最もよくあてはまる選択肢を 1 つ選べ.

強化学習では,行動を学習する(ア)と(ア)が行動を加える対象である(イ)を考え,行動に応じて(イ)は(ア)に状態と(ウ)を返す.行動と状態/(ウ)の獲得を繰り返し,最も多くの(ウ)をもらえるような方策を得ることが強化学習の目的である.

編集履歴(0)

G検定模擬試験set1

編集履歴(0)

ログイン / 新規登録

 

アプリをダウンロード!
DiQt

DiQt(ディクト)

無料

★★★★★★★★★★