AI科技 大数据 智慧城市 智能教育 过程奖励模型也可以测试时扩展?清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o 4 月 15, 2025 yinhua 清华大学联合上海 AI Lab 提出生成…