仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
小米开源首个为推理(Reasoning)而生的大模型「XiaomiMiMo」
MiMo仅用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。
HuggingFace:https ://huggingface.co/XiaomiMiMo
技术报告:https ://github.com/XiaomiMiMo/MiMo/blob/main/MiMo-7B-Technical-Report.pdf
总训练25Ttokens。
去年底,营销号说是雷军千万年薪挖了deepseek的天才少女,5个月过去了,所以,这是交的答卷么?