AI Agent已发现新知识,2年内大模型将有惊艳突破|2025 Snowflake峰会圆桌


AI Agent已发现新知识,2年内大模型将有惊艳突破|2025 Snowflake峰会圆桌

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

讨论伊始,SnowflakeCEOSridharRamaswamy提到,生成式AI已经开启了从代码编写到哲学思辨的无限可能。他指出,“这一进程始于基础模型。它们使数十亿用户得以接触并运用那些他们以往无法企及的数据力量。它们为我们所有人彻底改变了游戏规则。”作为行业领导者,SamAltman带领OpenAI从开创性研究走向如今影响数十亿人的产品,真正在全球范围内推动了人工智能的演进。
01
AI年度之变:模型可靠性大幅提升,诸多场景成熟可用
人工智能正深刻地重塑各行各业,企业决策者当前最关注的核心问题是如何洞察先机并有效部署AI战略。对于此,SamAltman表示:“我认为关键在于立即行动。”他观察到,目前观望情绪依旧浓厚,模型迭代速度极快,人们总有理由等待下一代模型,或者观望局势会如何演变,或者犹豫是否应该采用方案A或方案B进行构建。”
但他提出,技术发展的一条普遍规律是当变革迅猛发生时,那些拥有最快迭代速度、能够最大限度降低试错成本并最大化学习效率的公司,将会胜出。他从企业应用人工智能的实践中观察到,那些尽早布局并快速迭代的公司,其表现远胜于那些仍在等待局势明朗的公司。
SnowflakeCEOSridharRamaswamy提到,包括OpenAI、Snowflake在内的许多公司,已经将实验的门槛降得非常非常低了。大家可以进行大量的小型实验,从中发掘价值,并以此为基础不断发展。他指出,迭代速度最快的企业或个人,将能从中获得最大价值,因为他们了解哪些方法可行,哪些不可行,这些企业和个人才能驾驭瞬息万变的未来。
两位嘉宾都指向了“立即行动、快速迭代”的共识,不过AI技术本身正以前所未有的速度发展。这些核心的行动建议,在过去一年中是否因技术的飞速成熟而有所演变和侧重调整?
对此,SnowflakeCEO回应:“我想我去年也会给出同样的建议。”他表示,技术本身也在飞速成熟。例如,你现在完全可以使用ChatGPT获取最新事件的信息,因为它知道何时通过网络搜索来提供这些内容。因此,无论是聊天机器人,还是处理结构化或非结构化数据,许多应用场景的技术已经成熟,可以直接采用。”他补充道,你永远可以去探索和拓展它的应用边界。目前有一些更前沿的AIAgent应用,但他认为,即便不触及那些最尖端的领域,这项技术实际上也已经为大规模主流应用做好了准备。
SamAltman则表示去年可能不会完全这么说。关于态度的转变,他表示:“我去年会对初创公司说同样的话,但对大型企业,我可能会建议他们做些小范围的实验,因为在大多数情况下,这项技术或许还未完全准备好投入生产环境。”不过他也指出,“现在情况确实不同了,我们的企业业务取得了飞速发展,我们与许多大型企业交流,它们现在确实在大量业务中采用了我们的技术。”关于改变的原因,企业反馈称,部分在于适应和理解的过程,但更重要的是,现在的模型运行确实可靠多了。它能够胜任许多我以前认为不可能实现的事情。”SamAltman总结道:“事实也的确如此,似乎在过去一年的某个节点,这些模型的可用性迎来了一个真正的转折点。”
对于未来,SamAltman展望:“现在,一个有趣的问题是,明年我们又会有什么新的见解。而且我认为,到明年,我们将达到这样一个阶段:你不仅能用一个系统来自动化某些业务流程,或构建新的产品和服务,你甚至可以真正地说:‘我的企业面临一个至关重要的问题,只要你能解决它,我会投入海量的算力。’届时,模型将能够解决那些单凭人力团队无法攻克的难题。”他进一步说明:“那些已经积累了模型使用经验的公司,将能更好地适应这样的未来,他们可以对AI系统说:‘好的,去把我们最关键的项目重做一遍,这里有充足的算力,请深度思考,找出解决方案。’我认为,为那一刻做好准备的人们,明年将再次迎来一个巨大的飞跃。”
02
AI系统的信息机制:内存与检索的角色
两位嘉宾提到的,当前AI模型在可靠性与处理复杂任务能力上的显著提升,是企业得以更全面、更深入应用AI的关键。这种能力的跃升,必然依赖于核心技术组件的支撑与优化,尤其是AI系统中扮演信息处理与调用关键角色的内存及检索机制。
SnowflakeCEO称,他认为,像检索这样的功能,在确保生成式AI技术在必要时能够基于事实、保持准确性方面,始终扮演着关键角色。如果你提出一个基于事实的问题,你自然希望得到一个可靠的答案。他提及具体实践:“早在2023年初,我们就基于GPT-3构建了网络搜索规模的系统。这样,每当你提出的问题需要援引现实世界的参考信息才能回答时,系统就能够提供相关的上下文。”他进一步解释“内存”的作用:“系统了解你过去是如何处理特定问题的,也就是内存,你与特定系统的交互历史,都能够极大地影响并优化该系统未来的表现。”
他认为,随着我们将这些模型应用于越来越多样且复杂的任务,内存与检索的作用将持续增强。你提供的上下文越丰富,这些系统无论是在交互层面还是在AIAgent的自主行为层面,表现都会越出色。
03
AIAgent的能力边界与AGI
对上下文和历史信息的高效利用,是AIAgent发展的技术基础之一。对此,SamAltman以OpenAI最新的CodingAgent——Codex为例,展示AIAgent已展现出的接近自主决策与复杂任务处理的能力,甚至让他体验到了“AGI的感知”。
SamAltman称,你观察它工作,给它分配一系列任务,它就在后台自主执行。它非常聪明,能够处理这些具有长远规划的任务,而你只需坐在旁边,对它的某些决策表示肯定或否定,或者让它重试。他列举了Codex的能力:“它能够连接到你的GitHub;未来,如果你允许,它甚至可以旁听你的会议,查看你的Slack消息,阅读你所有的内部文档——它所做的事情着实令人印象深刻。”
SamAltman以一个比喻展望其发展:“或许今天它还像一个只能工作几小时的实习生,但未来某一天,它会成长为能够连续工作数天的资深软件工程师。”他预言,我们将会看到类似的能力扩展到许多其他工作领域。你会听到一些公司正在构建AIAgent,以期自动化大部分客户支持、电话销售或其他诸多业务环节。你也会听到有人说,他们现在的工作就是给一群AIAgent分配任务,评估工作质量,协调整合各项成果,并提供反馈。这个流程听起来非常像他们管理一个相对初级的员工团队的日常。”他表示:“这一切已经初现端倪,虽然尚未普及,但趋势已然形成。”
对于AIAgent更长远的未来,SamAltman说:“我预计明年,至少在某些限定场景和小范围应用中,我们将开始看到AIAgent能够帮助我们发现新知识,或者针对企业面临的那些颇为棘手的问题找出解决方案。”他指出现阶段与未来的区别:目前,AIAgent的应用主要还停留在自动化处理那些重复性的、初级的认知工作,且时间跨度较短。但随着其能力向更长的时间维度和更高的复杂度扩展,未来某个时刻,我们将会拥有AI科学家——能够自主发现新科学知识的AIAgent,那将是世界发展史上的一个重要里程碑。
AIAgent能力的不断增强,AGI是否近几年内实现?我们距离它到底还有多远?它的实现对我们又意味着什么?
对此SamAltman表示,如果能让大多数人回到五年之前,比如2020年,当时的世界还没有见识过一个真正优秀的大语言模型。如果你能回到那一刻,向人们展示今天的ChatGPT,就只是ChatGPT,我想大多数人都会毫不犹豫地说,这就是AGI。
他表示:“我们非常善于调整自己的预期,我认为这是人性中非常了不起的一点。”SamAltman认为:“AGI究竟是什么,这个问题本身并不那么重要。这是一个定义因人而异的术语,甚至同一个人在不同时候也会给出不同的定义。真正重要的是,过去五年我们所见证的这种逐年进步的速度,至少在未来五年内仍将持续,甚至可能远超五年,尽管这很难断言。至于你是在2024年、2026年还是2028年宣布AGI的实现,又或是在2028年、2030年还是2032年宣布超级智能的到来,这些节点远不如那条漫长、优美且惊人平滑的指数级发展曲线来得重要。”
至于他个人对AGI的一个标准是:“一个能够自主发现新科学的系统,或者一个能为人类提供强大助力,使全球科学发现速度提升四倍甚至更多的工具。”不过,他也提及了其他的看法:“有些人会说,AGI必须是一个能够自我完善的系统。还有很多人会认为,像今天这样拥有记忆功能的ChatGPT,就已经非常接近AGI了。”
SnowflakeCEO则更关注AI进步的速度及其带来的实际效益,而非某个精确的“AGI时刻”。Ramaswamy表示:“我认为这正如Sam所说,成了一个可以辩论的问题。在我看来,这有时也是一个哲学问题,好比问:潜艇会游泳吗?”他认为当前模型已拥有令人难以置信的能力,若在2020年看到2025年的能力,也会惊叹为AGI。他强调:“对我而言,真正令人震惊的是其进步的速度。我坚信这将带来许多美好的事物。”他以高性能计算机击败国际象棋世界冠军为例,指出这并未妨碍优秀棋手的存在,反而使棋类运动更受欢迎。
04
关注AI能力曲线
与其纠结于AGI的确切定义,不如关注AI能力曲线。那么在不久的将来,我们能期待下一代模型展现出哪些更令人惊叹的“涌现行为”?
对于未来一两年内的新模型可能展现哪些“涌现行为”足以改变运营、产品构建乃至OpenAI的运作,SamAltman透露:“未来一两年内的模型将会相当惊艳,进步空间依然巨大。”他预示企业将能借助新模型解决以往无法想象的难题:“就是将你最棘手的问题交给它。例如,芯片设计公司可以指令模型:‘设计一款超越我以往所有产品的芯片。’生物科技公司可以要求:‘协助我研究这个疾病课题。’”
他还详细描述了未来模型的能力:“这些模型能够理解你想提供的所有上下文,连接到所有需要的工具和系统,然后进行非常深入的思考,展现出卓越的推理能力,并给出答案。同时,它们还具备足够的鲁棒性,让你能够信任它们自主完成某些工作。”
他坦言:“我不知道我是否曾预料到这一天会如此临近,但现在它确实感觉非常近了。”SamAltman倾向于使用的思考框架,并非具体产品,而更像一种“柏拉图式的理想状态”:“是一个体积微小但拥有超人推理能力的模型。它能以极快的速度运行,拥有一万亿Token的上下文,并且能够接入你能想象到的所有工具。
因此,问题的具体内容变得不再重要,模型本身是否预先存储了相关知识或数据也无关紧要。”他指出:“将这些模型视为数据库其实有些荒谬,因为它们是非常缓慢、昂贵且极易出错的数据库。然而,其真正令人惊叹之处在于它们的推理能力。如果你将它视为一个推理引擎,我们可以将一个企业或个人生活中的所有可能上下文,以及他们进行物理模拟等任务所需的任何工具都提供给它,那么人们所能做到的事情将是相当惊人的。我认为,我们正朝着这个方向发展。”
未来模型如此强大,若计算资源获得数量级上的飞跃,例如达到当前的一千倍,又将解决哪些当前难以想象的问题?
SamAltman表示:“我会让它在AI研究领域全力以赴,探索如何构建出远胜以往的模型,然后再去问那个更强大的模型,我们应该如何利用这所有的算力。我们现在无论是在ChatGPT内部,还是在那些使用我们最新模型的企业中,都看到了许多案例,表明在测试时计算上投入更多是能带来实际回报的。”
如果你允许模型进行更长时间的推理,或者在难题上进行更多次的尝试,你现在就已经能得到远为出色的答案。”
他设想:“如果一个企业决定在每个问题上都投入一千倍的算力,它将会获得一些惊人的成果。当然,现实中你不会真的这么做,你也没有那一千倍的算力,但这种可能性本身,我认为确实揭示了人们今天可以尝试的一件有趣的事情:即真正将其视为一种幂律现象,愿意为你最棘手或最有价值的问题投入更多的计算资源。”
【AI技术与应用交流群|仅限受邀加入】
AI算力领域TOP级从业者专属圈层
√与头部算力企业深度对话
√与AI上下游企业深度对话
√获取一手全球AI与算力产业信息
√获取AI热点及前沿产业独家信息
√随时了解全球AI领域高管最新观点及实录全文
√有机会参与AI主题产业交流活动
扫码验证身份(需备注姓名/公司/职务)
不止有DeepSeek,更有AI产业的未来!
|文章来源:数字开物
•END•
【专栏】精品再读
AI与数据中心出海东南亚面临两大挑战|万字圆桌实录
2万字完整演讲实录:最强TPU芯片、全新AIAgent来了|谷歌云Next大会
黄仁勋3万字完整精校实录:\“思考型token\“爆发,AIinfra即将巨变
深度|“唤醒”特斯拉,进击的中国Robotaxi


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录