MiniMax发布推理模型对标DeepSeek,算力成本仅约53万美元

00:00
01:16
主播信息
Wind万得

Wind万得

万得信息技术股份有限公司是一家特别专业的金融软件服务提供商,总部位于上海陆家嘴金融中心,在全球有48个分支机构。
关注
财经头条
3024
听一听,洞悉财经圈头条大事。 (免责声明:本节目由人工智能(AI)生成,无法保证所有内容100%正确,仅供参考,不构成对任何人的投资建议。听众应自行验证信息的正确性,万得不对任何投资行为及其后果承担责任。)
一刻
554
“财经无界,新闻有点”。这一刻,有深度、有态度!有热点、有观点!
陆家嘴财经早餐
5327
陆家嘴财经早餐由万得资讯倾力打造,让您在第一时间了解最全最新的财经资讯,上班族早上醒脑充电必备!(关注“万得资讯”公众号,每天早晨推送早餐文字版全部内容哦~)
APP内查看主播
节目详情

# MiniMax推理模型发布

# 高效推理模型技术

# DeepSeek对标模型

# 算力成本优化方案

# 月之暗面开源动态

# 编程模型性能领先

# 基准测试性能突破

# 高效训练过程创新

AI大模型公司MiniMax于6月17日宣布,推出首个开源推理模型MiniMax M1,计划连续5天发布重要技术更新。该模型通过强化学习训练阶段仅耗时3周,使用512块H800 GPU完成,算力成本优化方案成效显著,总成本约53.47万美元,较预期降低一个数量级。官方称其高效推理模型技术在多项基准测试中接近海外领先模型,性能比肩DeepSeek R1和Khun3等开源模型。
同日,月之暗面开源编程模型Kimi DV72B,该模型基于阿里云Khun 2.5-72B微调而成,在SWE Bench编程基准测试中实现性能领先,超越新版DeepSeek R1,成为全球最高水平的开源编程模型之一。
两家公司同期发布技术成果,引发开发者广泛关注。MiniMax预告后续将推出更多更新,进一步展示其在高效训练过程创新与基准测试性能突破上的进展。此次动态反映了国内AI企业在模型研发与算力成本控制领域的快速迭代能力。

展开
大家都在听
评论(0条)
快来抢沙发吧!
打开蜻蜓 查看更多