标签: 从人类演示到智能体行为,通过动作片段量化实现人类风格的强化学习智能体