小米也开源推理模型了。拳打o1,脚踢Qwen~


小米也开源推理模型了。拳打o1,脚踢Qwen~

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

小米开源首个为推理(Reasoning)而生的大模型「XiaomiMiMo」
MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。
HuggingFace:https ://huggingface.co/XiaomiMiMo
技术报告:https ://github.com/XiaomiMiMo/MiMo/blob/main/MiMo-7B-Technical-Report.pdf
总训练25Ttokens。
去年底,营销号说是雷军千万年薪挖了deepseek的天才少女,5个月过去了,所以,这是交的答卷么?


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录