仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
这距离该公司去年推出仅过去不到一年,且距其首次700万美元融资仅隔六个月。
总部位于旧金山的Goodfire推出了平台Ember,旨在帮助开发者理解大模型的运行机制。大模型大量名为人工神经元的代码片段组成,传统上,识别哪些神经元参与处理特定提示及其交互方式是开发难点。
而通过Ember,开发者输入提示后可映射出模型中参与处理的组件,这种可视化能力有广泛应用场景:当大模型生成不准确响应时,开发者能定位问题组件并禁用;还能识别易受提示注入攻击的组件并进行修复,提升模型安全性。
在模型定制方面,Ember可帮助企业优化开源大模型。例如开发客服聊天机器人时,可剔除无关组件以构建更高效的模型。开发者还能通过自然语言指令定制模型功能,如要求模型在响应中加入双关语,Ember会自动定位并更新相关组件。此外,平台支持检索增强生成(RAG)技术集成,通过“条件”功能简化外部数据接入,并提供模型能力映射工具。
Goodfire还积极开源技术成果,其开发的稀疏自动编码器(SAE)可自动化解析神经网络内部结构。去年该公司为Meta的Llama3.370B模型开发了SAE,本月又开源了针对DeepSeekR1推理模型的两款SAE,后者揭示了R1减少输出错误的具体步骤。
本文素材来源Goodfire,如有侵权请联系删除
END