最終更新日:2023/07/13
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
強化学習では,行動を学習する(ア)と(ア)が行動を加える対象である(イ)を考え,行動に応じて(イ)は(ア)に状態と(ウ)を返す.行動と状態/(ウ)の獲得を繰り返し,最も多くの(ウ)をもらえるような方策を得ることが強化学習の目的である.
編集履歴(0)
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
強化学習では,行動を学習する(ア)と(ア)が行動を加える対象である(イ)を考え,行動に応じて(イ)は(ア)に状態と(ウ)を返す.行動と状態/(ウ)の獲得を繰り返し,最も多くの(ウ)をもらえるような方策を得ることが強化学習の目的である.