RL 圈的夏夜之约!12 人唠嗑局:当强化学习撞上大模型 Agent


RL 圈的夏夜之约!12 人唠嗑局:当强化学习撞上大模型 Agent

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

大模型时代卷起技术狂潮,强化学习(RL)早已不是“小众玩家”,当它牵手大模型智能体,直接开启「王炸组合」模式!想不想潜入神秘据点,边嗨边聊最in的RL新范式?7月26日晚,由机器之心主办、东浩兰生支持,作为WAIC官方活动之一的「强化学习新范式探索之夜」热力开启,咱们组个「技术吐槽局」+「脑洞开黑局」,等你带「料」赴约~
主题:强化学习新范式探索之夜:从基础模型到Agent的进阶之路
时间:2025年7月26日19:00-21:10(白天逛完WAIC直接转场,不耽误你狂卷干货又能嗨聊技术~)
地点:上海世博展览馆附近
规模:仅限12位,手慢无!主打一个“小而精”的深度贴脸交流,拒绝人海战术,每个人都能疯狂输出!
1.「强化学习×大模型智能体」:CP组合如何原地封神?
2. 训练推理两难:探索新策略VS守稳基本盘,怎么选?
3. 对齐评估大考:如何让智能体“听话又能打”?
🔥已锁定的「技术搭子」阵容
▪️吴翼|清华大学交叉信息研究院助理教授(学术圈「理论脑洞王」本王)
▪️周王春澍|OPPOAI个性化实验室负责人(产业界「落地操盘手」)
▪️朱哲清|PokeeAICEO(创业圈「实战先锋」)
✅产业界「实战老炮儿」:捧着你的落地案例、避坑指南来分享江湖经验!
✅创业圈「技术弄潮儿」:揣着你的产品痛点、合作需求来链接技术战友!
划重点:拒绝照本宣科!我们要的是「带劲儿的观点碰撞」「敢吐槽的真实交流」,哪怕是未验证的脑洞,也能在这里找到共鸣!
❶小众局才够味:12人封顶,不做听众;人人都是主角,全程高光!
❷场景反内卷:不在会议室正襟危坐,灵感说不定藏在酒杯里~
❸链接真大佬:从学术前沿到产业落地全给你配齐了,错过后悔一整年!
扫描下方二维码,告诉我们你的身份标签(学术/产业/创业)+最想聊的RL痛点,我们将优先邀请「带料的技术实力派」!
PS:名额有限,手速要快!7月10日12点前锁定席位,别让你的技术脑洞憋到过期~
🚀最后一句掏心窝的话:
RL的世界不缺论文和报告,缺的是「敢把技术聊成段子」「敢为难题拍桌争论」的同路人。这个夏夜,让我们跳出框架,在轻松氛围里搞点「不一样的技术革命」——你,准备好上车了吗?


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录