最終更新日:2023/07/13
(ア)に最もよくあてはまる選択肢を 1 つ選べ.
機械学習による分析を行う際,カテゴリーデータをそのまま扱うのは非常に難しい.このため,これを数値に変換して扱いやすくすることが一般的である. ドリンクのサイズ S, M, L などの順序を持つ文字列のカテゴリーデータの場合,それぞれの値に対応する数値を辞書型データで用意し,これを数値に変化する方法 (ア) を利用して変換を行うことがある. また順序を持たない名義特徴量のカテゴリーデータについては,各変数に対応したダミー変数を新たに作り出す (イ) が有用である.
編集履歴(0)