RL 圈的夏夜之约！12 人唠嗑局：当强化学习撞上大模型 Agent

发布日期: 2025-07-08

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

大模型时代卷起技术狂潮，强化学习（RL）早已不是“小众玩家”，当它牵手大模型智能体，直接开启「王炸组合」模式！想不想潜入神秘据点，边嗨边聊最in的RL新范式？7月26日晚，由机器之心主办、东浩兰生支持，作为WAIC官方活动之一的「强化学习新范式探索之夜」热力开启，咱们组个「技术吐槽局」+「脑洞开黑局」，等你带「料」赴约~
主题：强化学习新范式探索之夜：从基础模型到Agent的进阶之路
时间：2025年7月26日19:00-21:10（白天逛完WAIC直接转场，不耽误你狂卷干货又能嗨聊技术～）
地点：上海世博展览馆附近
规模：仅限12位，手慢无！主打一个“小而精”的深度贴脸交流，拒绝人海战术，每个人都能疯狂输出！
1.「强化学习×大模型智能体」：CP组合如何原地封神？
2. 训练推理两难：探索新策略VS守稳基本盘，怎么选？
3. 对齐评估大考：如何让智能体“听话又能打”？
🔥已锁定的「技术搭子」阵容
▪️吴翼|清华大学交叉信息研究院助理教授（学术圈「理论脑洞王」本王）
▪️周王春澍|OPPOAI个性化实验室负责人（产业界「落地操盘手」）
▪️朱哲清|PokeeAICEO（创业圈「实战先锋」）
✅产业界「实战老炮儿」：捧着你的落地案例、避坑指南来分享江湖经验！
✅创业圈「技术弄潮儿」：揣着你的产品痛点、合作需求来链接技术战友！
划重点：拒绝照本宣科！我们要的是「带劲儿的观点碰撞」「敢吐槽的真实交流」，哪怕是未验证的脑洞，也能在这里找到共鸣！
❶小众局才够味：12人封顶，不做听众；人人都是主角，全程高光！
❷场景反内卷：不在会议室正襟危坐，灵感说不定藏在酒杯里～
❸链接真大佬：从学术前沿到产业落地全给你配齐了，错过后悔一整年！
扫描下方二维码，告诉我们你的身份标签（学术/产业/创业）+最想聊的RL痛点，我们将优先邀请「带料的技术实力派」！
PS：名额有限，手速要快！7月10日12点前锁定席位，别让你的技术脑洞憋到过期～
🚀最后一句掏心窝的话：
RL的世界不缺论文和报告，缺的是「敢把技术聊成段子」「敢为难题拍桌争论」的同路人。这个夏夜，让我们跳出框架，在轻松氛围里搞点「不一样的技术革命」——你，准备好上车了吗？