Google的Diffusion大模型,快如闪电,实测震惊


Google的Diffusion大模型,快如闪电,实测震惊

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

大家好,我是Ai学习的老章
看Apple刚刚开源了一个7B的DiffuCoder大模型
Apple这个有空再细看
这倒让我想起5月Google开源的GeminiDiffusion,当时就申请了Waitlist,很久没打开Gmail,发现5月29就收到access的邮件了
Diffusion不是新鲜概念,后来OpenAI的DALL·E2和Google的Imagen等文生图模型问世后,DiffusionModels重新火起来。
但是把生成式模型用于文本生成是最近的小热点,Mercury,LLaDA-8B,Dream7B,gemini-diffusion,AppleDiffuCoder都来了
传统的自回归语言模型一次生成一个单词(或词元)的文本,这种顺序过程可能会很缓慢,并且会限制输出的质量和连贯性。
速度有多快呢?GeminiDiffusion的介绍:
1479个词元/秒
0. 84秒
扩散模型的工作方式有所不同,它们不是直接预测文本,而是通过逐步优化噪声来学习生成输出。
这意味着它们可以非常快速地对解决方案进行迭代,并在生成过程中纠正错误。这有助于它们在编辑等任务中表现出色,包括在数学和代码方面。
GeminiDiffusion是GoogleDeepmind团队的产品,官方介绍优势如下:
快速响应:生成内容的速度远超我们迄今为止最快的模型
文本连贯性更强:一次性生成完整词块,这意味着相比自回归模型,它能更连贯地回应用户提示
支持迭代优化:在生成过程中纠正错误,以获得更一致的输出。
目前依然需要waitlist才能使用
十几天后才收到邮件
使用地址:https ://deepmind. google.com/frontiers/gemini-diffusion
实测速度真TM的快,眼球👀跟不上
这里我借用MiniMax的测试提示词,并给出minimax与GeminiDiffusion生成结果对比
MiniMax
GeminiDiffusion
MiniMax
GeminiDiffusion
MiniMax
GeminiDiffusion
其实我还测试了几个中文相关的非代码类任务,弱鸡的很
目前感觉,它最强优势就是一个字☝️:快!
制作不易,如果这篇文章觉得对你有用,可否点个关注。给我个三连击:点赞、转发和在看。若可以再给我加个🌟,谢谢你看我的文章,我们下篇再见!
搭建完美的写作环境:工具篇(12章)图解机器学习-中文版(72张PNG)ChatGPT、大模型系列研究报告(50个PDF)108页PDF小册子:搭建机器学习开发环境及Python基础116页PDF小册子:机器学习中的概率论、统计学、线性代数史上最全!371张速查表,涵盖AI、ChatGPT、Python、R、深度学习、机器学习等


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录