中国最强编程模型来了! 阿里Qwen3.6-Plus性能直逼Claude,国产大模型杀入决赛圈

张开发
2026/6/9 8:28:30 15 分钟阅读
中国最强编程模型来了! 阿里Qwen3.6-Plus性能直逼Claude,国产大模型杀入决赛圈
梦瑶 闻乐 发自 凹非寺量子位 | 公众号 QbitAI什么这code那code先别code了因为——中国最强编程模型来了就在刚刚阿里突袭发布Qwen3.6-Plus新一代基座大模型在编程和智能体能力上直接捅破了国产大模型的天花板强到Next Level那…到底有多Next呢 1M上下文直接拉满不仅能独立拆解任务、规划执行路径、全程自测迭代达到目标还能根据简单提示词搓出Vibe Coding。这不嘛前几天模型的preview版本提前上了OpenRouter小编也拿到开白资格抢先实测了一番我只给了AI一句话几秒钟就得到了一个可移缩放的3D的雪山场景多模态网页连雪花都是动态飘落的模型表现归模型表现关键还是要拉到真实评测中见真章啊值得一提的是在涵盖智能体编程、真实世界任务的权威评测中Qwen3.6-Plus目前已经成为了最接近全球最强Claude系列的国产模型Claude不er哥们儿专业搞代码的大佬们拿到Qwen3.6-Plus更是爽感拉满这不嘛提前体验过的网友们速速给出反馈了——下面这位大哥直言速度和生成体验感比Claude更夯Opus 4.6你还得加把劲儿啊更有硬核网友直接开了压力测试在5个复合仓库里轮番轰炸得出的结论嘛甭说别的这模型是真靠谱目前Qwen3.6-Plus已第一时间上线阿里云百炼且API服务已全面开放此外在悟空、千问APP等阿里AI应用和平台也已同步上线。这下好了大家可以——直接上手搓搓搓了Vibe Coding、多模态理解能力忒夯不知道大家们还记不记得上个月Qwen3.5刚发布的时候全网都在感叹模型强大的编程能力。但老话说得好一代更比一代强事实上相较于上一代模型这次发布的Qwen3.6-Plus在编程Coding能力、智能体Agent能力和工具调用能力上直接上演了一场大型的《自己卷自己》的戏码。doge咋个卷法呢在性能上Qwen3.6-Plus表现出了比上一代模型更敏锐的理解感知能力和更强大的多模态推理能力。在SWE-bench系列真实编程任务测试、考察终端编程的Terminal-Bench2、长程编程任务NL2Repo以及Claw-Eval、QwenClawBench等真实世界Agent能力评测中——Qwen3.6-Plus几乎直逼Claude Opus 4.5甚至部分性能表现比Claude更优还超越了2倍乃至3倍参数量的其他主流模型。看来千问妥妥掌握了「以小胜大」的秘方啊不仅如此基于百万token的上下文窗口。模型还集中对OpenClaw、Qwen Code、Claude Code、Kilo Code、Cline、OpenCode等系列Agent框架进行了优化支持。是的这模型卷的已经不只是模型本体连整套Agent工作流的适配度都梭哈了…只能说——《夯极夯》。咱们直接老规矩围绕模型擅长的Vibe Coding、多模态理解、问题重构等几个能力维度上实打实测一波Vibe Coding能力实测常言道用编程模型必玩Vibe Coding所以咱就先来考一考Qwen3.6-Plus在网页开发上的能力大家都知道对AI或者Agent来说网页开发其实不是啥难事儿真正的挑战在于——只用一句简单提示词就能做出兼具视觉设计、交互逻辑与页面跳转的完整页面所以咱这次直接把难度抬高。用一句大白话指令让AI一键生成一个可交互的「AI资讯日历网站」帮我生成一个有科技感的AI日历网站。首页为月历视图每一天标注对应的AI大事件用户点击日期后可进入详情页查看完整内容包括事件标题、一句话简介、时间和来源链接。大概2分钟的时间AI就给我搓出来了个完成度相当高的AI资讯日历网页。从前端生成效果来看整体视觉简洁而且科技味儿还蛮浓不仅清晰呈现了日历结构还自动对不同资讯做了色彩区分阅读体验十分友好在具体交互能力上还支持前后月份翻阅查询每日日期格子内均标注可点击的资讯入口点一下就能查看摘要内容。此外不知道大家发现没页面右侧还附带一个可跳转链接一键就能跳到原资讯网站查阅信息源贼方便接下来我们换种玩法不生成网页了改玩点有意思的。挑战用一句话让AI帮忙制作一个可交互的色彩度比较鲜明的3D的雪山场景看看这AI在前端视觉上的表现力咋样。制作一个3D的雪山场景雪山中间有一个日式的寺庙整体风格参考塞尔达旷野之息。先看视觉效果u1s1确实有点塞尔达那种清新明快画风的意思色彩饱和度和光影质感肉眼看都还是蛮舒服的。不仅如此我还可以灵活拖动视角360度旋转场景、用滚轮自由缩放远近这些都ok甚至连雪花粒子都是动态飘落的我们继续挑战再来实测一些更好玩的场景这回看看Qwen3.6-Plus的「游戏网站」搭建能力咋样帮我做一个虚拟宠物养成网页页面主体是宠物的房间用户可以随时看到它的状态宠物有饥饿、心情、体力和成长值会随时间变化用户可以在房间里进行喂食、玩耍、洗澡、睡觉等互动加入简单动画、表情变化、随机事件和任务系统完成可获得金币购买道具整体风格可爱So cute瞬间梦回小时候玩的《皮卡堂》小游戏萌翻了.jpg从实际效果看在这个页面里我不仅可以查看宠物的动态宠物还可以跟着我的鼠标位置进行移动。不仅如此页面右侧还设有状态值、互动功能、任务和商店四大板块我还可以根据宠物状态进行喂食、玩耍等互动操作。你还真别说Qwen3.6-Plus在审美和交互设计这块儿提升不少确实真·有两下子…咱们最后再来试一个大家几乎都玩过的消消乐小游戏这次我直接把提示词写到简单不能再简单生成一个美食卡通主题的消消乐小游戏网站。哪怕提示词如此大白话哪怕如此简单这输出效果也确实没得说。是的我只用了一句提示词Qwen3.6-Plus把核心玩法、连锁机制、视觉UI、辅助能力这些全cover了…多模态理解能力实测除了强大的Vibe Coding能力外Qwen3.6-Plus在多模态理解这块儿也属实有两把刷子。具体来说就是从视觉感知到多模态推理再到智能体执行都能hold得住这次我喂给了模型一段AI资讯类的视频内容整个视频时长说实话还蛮长的很考验模型的内容解析能力。我要让它做的不单单只是解析视频核心内容而是要让它帮我进行逐秒脚本分析并且根据内容二创成一份适合小红书笔记发的爆款文案以下是我喂给Qwen3.6-Plus的原视频请你帮我解析一下这条视频内容做逐秒脚本拆解并根据视频内容二创成一篇适合发小红书的爆款笔记文案可以看到Qwen3.6-Plus不仅给我进行了逐秒的视频脚本拆解而且每一个视角戳里还帮我贴心地将脚本从视觉、内容、目的三个维度进行了推理判断。不仅如此在下方还按照要求输出了对应的小红书爆款文案并将文案概括成开头钩子、核心内容、关键发现、引起共鸣几个维度666啊最后的最后我们再来上点难度让Qwen3.6-Plus尝试根据图片内容复刻一个在线网页。这次我喂给了它一个旅游规划的页面图片让它根据页面里的功能直接复刻并搭建出一个完整的在线网页——哪怕几乎没有任何文字的提示词指令Qwen3.6-Plus依旧通过多模态能力准确出了图片的内容并且嘛——比我图片里手画的页面布局效果更好、视觉呈现更牛、内容更充实更复杂的编程场景照样在行看到这儿估计有朋友该说了上面这些场景多少有点太简单了吧。你还真别说更硬核的编程场景这不就来了嘛事实上除了能用简单提示词实现Vibe Coding、解析并执行多模态内容外Qwen3.6-Plus还能基于命令行工具生成页面、进行代码问题分析与重构甚至自主开发工具。在命令行页面生成能力上Qwen3.6-Plus支持通过CC等工具直接调用API。我们只需输入 「根据开源仓库生成landing page」这类简洁指令就能快速产出完整网页实现高效自动化的前端开发话不多说先给咱们「电子老婆」来个项目官网主页这里说的电子老婆正是GitHub上的开源项目AIRI—— 仿照超火虚拟主播Neuro-sama打造能实时陪聊、陪打游戏妥妥全天候在线的电子伴侣doge。通过VS Code中的Qwen Code插件我让Qwen3.6-Plus直接读取开源项目介绍自主理解需求、规划页面结构并一次性输出完整可用的代码提供项目根据这个开源项目生成landing page输出HTMLtailwind CSS。从Thinking过程可以清晰地观察到Qwen3.6-Plus一步步查看需求、创建文件整个过程能够实时监测Done耗时约3分钟Qwen3.6-Plus就生成好了项目官网页面代码自动保存在landing-page.html文件中咱打开html文件来看下效果首先看上去还蛮符合项目的宣传逻辑把临时体验页面、项目开源地址、社区地址全都关联上了。不仅如此导航栏还能够跳转到对应内容把项目介绍里包含的能力、可兼容的模型厂商、部署步骤都给概括全了不戳不戳接下来我们来测试模型的「问题分析与代码重构」能力。这次我又在Qwen Code命令行工具里喂给了Qwen3.6-Plus一坨问题不小的老旧代码让它捉捉虫提供项目我刚接手这个项目该怎么优化呢Qwen3.6-Plus看懂了原有逻辑自动整理了一份优化清单但是在动手之前还是询问了一句「需要开始实施吗」。比起其他大刀阔斧直接上手的模型来说这份分寸感把握得还是相当不赖的下一步当然就是让它帮我修改x山代码了我反手就是一个——这里一定要说个好玩的Qwen你的碎碎念也有太活人感了先给产品经理画饼然后去push服务器接着又在老板面前装模作样还有啥是你做不出来的说归说闹归闹任务还得按部就班搞下去修完Bug、再做优化主打一个有条不紊优化完成人家具体都改了点啥呢——请看下方总结。最后嘛还来了点小建议be like安装依赖、写测试脚本都可以直接交给它来做我全程省心省力只负责点头。美哉美哉Qwen3.6-Plus俺的编程本事可是不孬AI编程的门槛这回是真被打下来了说实话从今年年初开始我们真的接触了太多太多的AI Agent和各种Claw字辈儿的龙虾。此外还有一个大家感知很深的事是当下厂商们也越来越押注模型的编程能力各种Vibe Coding产品也层出不穷。我自己也在社交软件上刷到过很多感兴趣的项目点开之前觉得蛮有意思可一看对方用到的提示词和辅助工具我很快就意识到了一个问题。那就是没点提示词本事没点基础编程能力想做出和人家同款效果的Vibe Coding产品真的蛮难的…哭死…只能说大家还是苦Vibe Coding《上手门槛》久矣。△图片由AI生成这次实测Qwen3.6-Plus下来除了对于模型在复杂代码治理、跨域长程规划等真实世界的专业编程任务的中呈现的过硬能力外我更大的感受在于——它确确实实把普通人的「编程门槛」大幅拉低了。基于自然语言驱动的Vibe Coding不再是概念只要一句大白话我们就能把脑子里的想法直接变成可运行的现实。在过去很长一段时间行业默认用参数规模来换性能提升模型越大效果越好也越贵。而这一次Qwen3.6-Plus通过一个体量更轻的模型交出了可以对标甚至超过2到3倍参数模型的结果这对我们用户来说当然是好事情。当然更进一步从行业角度看也不难看出Qwen3.6-Plus也正是阿里ATHAlibaba Token Hub思路在编程模型上一次很有代表性的落地。创造高效Token、输送低成本Token、应用普惠化Token在ATH成立后仅一个月的时间就速速口号照进现实了。最后值得一提的是Qwen3.6-Plus是千问3.6系列推出的第一个模型。后面千问3.6系列还会开源更多不同尺寸的版本给大家另外性能更强的旗舰款Qwen3.6-Max也会在近期发布。大家可以小小期待一下子体验链接[1]Qwen Chathttps://chat.qwen.ai/[2]阿里云百炼https://bailian.console.aliyun.com/cn-beijing?tabmodel#/model-market/detail/qwen3.6-plus

更多文章