首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
首页
梁园区
睢阳区
永城市
夏邑县
虞城县
柘城县
宁陵县
睢县
民权县
示范区
民权县
>
正文
【阿里公布千问Qwen3.7】
2026-05-25 18:54:07
新浪新闻
5月阿里巴巴推出新一代千问旗舰模型Qwen3.7-Max,在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。据悉,千问3.7面向当下智能体全新设计,实现了编程、推理等核心能力的持续突破,甚至可全自主完成35小时的超长程智能体复杂任务:该领域上,Qwen3.7-Max借助自主编程和超1000次工具调用,实现了一个关键内核的自我进化,推理速度较原版本提升10倍。当下,编程能力已成为衡量LLM大语言模型的核心指标,Qwen3.7-Max较上代模型实现了大量提高,从前端原型开发到复杂的多文件工程均能驾驭。以往需专业团队耗时一至两周的复杂项目,现由 Qwen3.7-Max 驱动的智能体可在数小时内完工端到端交付闭环。经过MCP集成和多智能体协作,Qwen3.7-Max在企业级办公场景实现工作流自动化,在办公自动化基准 SpreadSheetBench-v1上斩获87分,处于顶尖水平,是可靠的办公与生产力助手。实战任务测试中,Qwen3.7-Max还展示了当下智能体所能达到的长程任务极限。千问3.7具有极强的Agent能力,并涌现出跨多种智能体框架的泛化能力,在 Claude Code、OpenClaw、Qwen Code 等框架下都能稳定发挥,有该领域的可靠底座。千问3.7是出色的编程智能体,可自主编写代码创造工具,精准执行任务,完成复杂编程的自我纠错迭代,就像个资深工程师,跑完从需求分析到测试迭代的全流程,自主产出可用的工业级成就。在一个模型训练时该领域平台——平头哥真武M890芯片上,千问3.7自主结束了一个复杂的推理内核优化任务。持续增强的编程能力,也为智能体完成更复杂、更长周期的任务打下坚实基础。在评估AI解决真实世界的实战编程任务SWE-bench系列测评、面向真实科学问题的编程测评SciCode中,Qwen3.7-Max较Qwen3.6-Plus大量增强,并超越了Claude Opus 4.6-Max、Kimi-K2.6、DeepSeek-v4-Pro-Max等模型。在该领域、硬件文档或新架构的示例内核情况下,千问3.7仅从一个包含任务描述、SGLang Triton 参考实现和评测脚本的空白工作空间出发,从“零”开始连续编程 35 小时,独立进行了 432 次内核评估、1158 次工具调用,完全自主地完工了编写、编译、性能分析与迭代改进的全流程。
<
上一篇:跳水世界杯总决赛:中国队包揽全部九金
热点排行
0
2026国际青春诗会(【中阿专】场)将汇聚多国青年诗人推进交流
0
OpenClaw逼出Claude最强反击!
1
{“太空种子”内蒙古传喜讯 育出“加速版”肉苁蓉}
2
"湖南省水利厅增强洪水防御应急响应至三级"
3
中国首条配网缠绕式|光缆上线 由机器人自主敷设
4
深圳出海中心正式|进入实体化运营阶段
5
广西北海海上风电单桩基础设备出运越南
6
何小鹏:激光雷达是个好东西,但在汽车行业已不是必需
7
1099 → 859 元新低:|安克 300W 充电宝百亿补贴,华为小米协议全兼容
8
业内探索以数字技术赋能|汽车服务行业高质量发展
9
<3602 万人次游四川! “五一”假期四川全域旅游活力迸发>
今日商丘
新浪微博
商丘网
商丘日报