当前类别:职培乐云平台> 职培乐在线考试评价平台> 人社部门> 浏览试题
[单选题]

在强化学习中,智能体通过什么方式来学习最优策略?
  • A直接模仿人类行为
  • B与环境交互获得奖励信号
  • C通过监督学习进行训练
  • D预先设定的规则
  • 收藏 查看答案
    相关题目