← 一覧へ戻る

略語

RLHF

ai

正式名称

Reinforcement Learning from Human Feedback

日本語説明

人間のフィードバックで方策を強化学習する手法です。

作成: 2026-04-26 10:52:16
更新: 2026-04-26 14:32:02