location_on 首页 keyboard_arrow_right 资讯 keyboard_arrow_right 正文

蚂蚁百灵万亿级参数思考模型开源在即:Ring-2.6-1T可调节推理强度引热议

资讯 2026-05-10 remove_red_eye 26 text_decreasetext_fieldstext_increase

5月10号据IT之家报道,蚂蚁集团旗下百灵大模型于5月9日正式发布万亿级参数思考模型Ring-2.6-1T,该模型已上线OpenRouter平台并开放限时一周免费体验,后续将正式向全球开发者开源,进一步完善开源大模型生态中的万亿级推理模型版图。Ring-2.6-1T作为一款面向真实复杂任务场景的旗舰思考模型,专为Agent工作流、工程开发及企业级应用打造,其推出标志着AI竞争正从参数规模转向任务执行效能的精细化比拼。

从技术细节来看,Ring-2.6-1T首次引入了可调节的Reasoning Effort(推理强度)机制,支持high与xhigh两种模式,旨在打破模型能力与计算资源消耗之间的固定配比。其中,high模式面向高频Agent协作,注重低Token开销与快速多步执行;xhigh模式则针对数学竞赛、复杂逻辑分析等高难任务,提供更深度的思考空间。这一创新设计使得开发者能够根据任务复杂度灵活控制思考深度,在效果、速度与成本之间实现更优平衡。

在真实任务执行类评测中,Ring-2.6-1T展现了显著的性能优势。high模式在PinchBench上得分87.60,超越同期的GPT-5.4 xHigh与Claude-Opus-4.7 xhigh等模型;ClawEval得分63.82,在可比模型中位居前列。高难推理任务方面,xhigh模式在ARC-AGI-V2上取得77.78分,在AIME 26数学竞赛中达到95.83分,GPQA Diamond达到88.27分,整体表现稳健。上述指标表明,该模型并非单纯追求参数规模,而是致力于以合理推理成本在复杂工作流中实现稳定交付。

从宏观层面观察,Ring-2.6-1T此时宣布开源,正处于国内人工智能开源生态加速建设的关键窗口期。近期国家网信办等三部门联合印发《智能体规范应用与创新发展实施意见》,明确提出引导开源社区加强智能体布局,推动智能体与开源大模型的兼容适配。蚂蚁百灵选择将万亿级思考模型开源,不仅有助于降低开发者的使用门槛,更将推动AI智能体在企业级工作流中的规模化落地。随着大模型竞争进入“智效优先”阶段,可调节推理强度这一技术路径或将成为行业标配。

阿里加码AI驱动购物,国内模式差异海外电商平台
« 上一篇 2026-05-10
24款手机App及SDK被工信部通报 移动应用隐私合规红线不可忽视
下一篇 » 2026-05-11