新闻资讯

小米开源“XiaomiMiMo”大模型:以7B参数超越OpenAIo1-mini

ZAKER 科技 4 月 30 日消息,"Xiaomi MiMo" 公众号今日发文宣布,小米开源首个 " 为推理而生 " 的大模型 Xiaomi MiMo,联动预训练到后训练,全面提升推理能力。据介绍,MiMo 是来自全新成立不久的 " 小米大模型 Core 团队 " 的初步尝试。

在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

官方表示,MiMo 推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,包括:

预训练:核心是让模型见过更多推理模式数据:着重挖掘富推理语料,并合成约 200B tokens 推理数据。训练:进行了三阶段训练,逐步提升训练难度,总训练 25T tokens。

后训练:核心是高效稳定的强化学习算法和框架算法:提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练。框架:设计了 Seamless Rollout 系统,使得 RL 训练加速 2.29 倍,验证加速 1.96 倍。

  • 标普警告澳大利亚AAA评级面临大选承诺带来的风险
  • 江西生物闯关港股IPO现疑云:股权接盘方关系密切 大客户现身特殊持股平台
  • 特斯拉董事会一直在物色一位新CEO来接替马斯克
  • 诺奖得主略萨去世,生前称“得奖一周是童话,一年是噩梦”
  • 网络达人“拿”别人的视频为自己带货赚佣金,法院判决赔偿1.4万元
  • 3500美元幻象?技术面信号暗示黄金多头陷阱已成形
  • 纽约汇市:英镑升至2022年以来最强水平 日元和瑞郎双双跃升1%
  • 2025澳门精准正版生肖图:生肖文化的新视觉呈现
  • 广西河池一商贩用公厕洗手池脏水浸泡菠萝销售,泡了33块卖掉6块,已被截获
  • 美国法官裁定苹果公司违令 立即整改
  • 环比萎缩0.3%!美国一季度GDP负增长,美股期指集体下跌,原油、纽约铜期货跳水
  • 俄总统助理:普京与美特使讨论了恢复俄乌直接谈判的可能性
  • 晋安实业4月29日上午9时正起短暂停牌
  • 视频|李大霄:坚定信心 稳定市场
  • 汇洲智能(002122)被立案,股民索赔分析
  • 关键词: