6月17日,上海AI独角兽MiniMax正式开源推理模型MiniMax-M1(M1),称其为全球首个开放权重的大规模混合注意力推理模型。M1结合混合门控专家架构(MoE)与Lightning Attention,在性能和推理效率上实现显著突破。实测显示,M1在长上下文理解、代码生成等场景中超越多数闭源模型,仅微弱落后于顶尖闭源系统。
M1支持最高100万token上下文输入和最多8万token输出。成本方面,进行8万Token深度推理时,M1算力需求仅为DeepSeek R1的约30%;生成10万token时,推理算力仅需DeepSeek R1的25%。
天使投资人郭涛分析认为,MiniMax此次更新填补了开源领域长上下文技术空白,以“开源+场景化”路径打破技术垄断,为国产大模型迈向实用化树立新标杆。