AG真人国际(中国)官方网站阿里发布Qwen3.7-Plus：屏幕贯串跑赢GPT-5.4，11小时孤独栽植App，“看、念念、写、作念”买通了！

发布日期：2026-06-05 03:59 来源：未知作者：admin 浏览次数：

MiniMax M3 模子昨日刚炸场，阿里千问又发布了一个强到可怕的新"怪物"。

6 月 2 日，阿里云通义千问团队在 X 平台认真晓谕发布Qwen3.7-Plus。这是一个多模态 Agent 模子，官方表述是"将视觉与说话长入为一体化智能体基座"。

沙巴体育app中国官网下载

团队用一句话来详细了它的居品定位："一个模子，能看、能念念、能写代码、能活动。"

用 Qwen3.7-Plus 作念 App、复刻股票欺诈不在话下。千问官方博客暴露，基于 Qwen3.7-Plus 构建的 Hybrid-Agent 系统，曾连气儿判辨驱动 11 小时以上，自动完成一款英语单词学习 App 的完好研发闭环。Hybrid-Agent 系统还自主完成了 macOS 原生 Stocks 股市欺诈的高保真复刻。而模子屏幕贯串得分 79，也提高 GPT-5.4 和 Gemini-3.1 Pro。

而千问此次发布的时刻点颇为精巧。就在前一天，MiniMax 刚刚推出新一代旗舰开源模子 M3，声称同期竣事顶尖编程才气、1M 超长凹凸文与原生多模态。两家在吞并周内密集发布，国内大模子开源竞赛愈发尖锐化。

Qwen3.7-Plus 的订价为：输入 $0.4/ 百万 token，输出 $1.6/ 百万 token。

"看、念念、写、作念"买通了：一个模子看屏幕、写代码、操作 App

Qwen3.7-Plus 的中枢看点，是把视觉贯串和任务践诺真确连在了一都。

官方博客描绘，这个模子能 "感知真的全国场景、读取屏幕并操作 GUI、基于视觉参考生成代码、端到端导航迁徙欺诈"，并在单一智能体轮回中无缝交融 GUI 与 CLI 交互。

这里有两个重要词：GUI 和 CLI。GUI 便是图形界面，比如网页按钮、手机 App 菜单、桌面软件窗口。CLI 便是呐喊行，比如工程师用来装置依赖、驱动测试、部署就业的玄色窗口。

随机说：它不仅仅 " 看懂图片 "，而是能看懂你的手机屏幕或电脑界面，然后我方点击、输入、跳转，把任务作念完。

比如，它不错读取屏幕，贯串手机 App 或网页界面里哪个按钮该点；也不错看一张想象图，然青年景 SVG、网页或前端原型；还不错在呐喊行里跑代码、看报错、再改代码。

连气儿跑 11 小时，栽植一个英语单词学习 App

对于 Qwen3.7-Plus 具体能作念什么：官方给了几个很居品化的演示。

Qwen 官方博客称，基于 Qwen3.7-Plus 构建的 Hybrid-Agent 系统，连气儿判辨驱动 11 小时以上，自动完成一款英语单词学习 App 的研发闭环。

细节包括：生成代码提高 10000 行，触发 Agent 调用提高 1000 次，遮盖需求文档生成、代码自动编写、自动化装置部署、测试用例创建、GUI 自动化测试、多场景并行测试、居品浮现自动更新和版块迭代。

这个案例的重要点不在于"写了若干代码"，而在于链路够长。一个真的软件任务经常不是一次生成代码就末端，还要装置、驱动、测试、改 Bug、再考证。官方演示念念强调的恰是这种长历程才气。

复刻炒股 APP，还接入真的行情 API

另一个官决策例是，奏凯作念一个炒股 APP。

Qwen 官方博客称，Hybrid-Agent 系统自主完成了 macOS 原生 Stocks 股市欺诈的高保真复刻。历程包括：交互原生欺诈并贯串 UI 布局和功能细节，基于交互记载生成 SwiftUI 源码，接入 LongBridge 真的行情 API 赢得及时市集数据，自动编译构建并启动复刻欺诈。

模子自主践诺了 10 项功能考证测试，骨子包括及时行情加载、股票领受与切换、多周期视图切换、搜索过滤和详备数据面板展示等，且全部通过。

这个演示更直不雅：模子不是只生成一个静态页面，而是要贯串行情 App 的结构、数据源和交互逻辑，再把它作念成一个不错驱动的桌面欺诈。

看图写代码：图像 / 视频转 SVG，也能生成网页原型

Qwen 官方博客称，Qwen3.7-Plus 不错将图像、视频、UI 截图和想象参考弯曲为可践诺代码，遮盖 SVG 复现到完好网页生成。

在图像 / 视频转 SVG 任务中，模子需要识别几何结构、颜料、布局、层级关系和动态变化，再用代码抒发出来。对于图标、插画、动效、图形想象和信息可视化，这类才气的居品价值在于：把"看见的参考图"酿成"可裁剪的代码钞票"。

在网页想象任务中，AG真人国际中国官网登录入口模子不仅要复现页面作风，还要组织布局、写前端代码、处理交互逻辑，并把多模态素材整合进最终页面。

同期，Qwen3.7-Plus 不错动作视觉 Agent，把视觉贯串和器用使用相聚起来，措置找不同、补图块、华容说念、走迷宫、拼拼图等任务。

这里的历程不是"看一眼给谜底"。模子会先贯串图像结构和拘谨，再把视觉问题转成可野心的问题默示，然后自主编写并践诺代码进行求解、搜索或考证。

跑分如何看：屏幕贯串跑赢 GPT-5.4，但不是通盘名堂都第一

在多模态基准测试上，Qwen3.7-Plus 有几个数字值得关心：

屏幕贯串和迁徙端操控：ScreenSpot Pro 得分 79.0，高于 GPT-5.4（67.4）和 Gemini 3.1 Pro（68.1）；AndroidWorld 得分 81.0，相通提高 Gemini 3.1 Pro（70.7）和 Opus-4.6 Max（62.0）。

数学视觉推理：MathVision 得分 90.3，接近 GPT-5.4 的 91.0，提高 Gemini 3.1 Pro 的 87.4。

搜索增强视觉问答：SimpleVQA 得分 81.7，WorldVQA 得分 61.1，在这一赛说念上与 Opus-4.6 Max 基本抓平。

图表识别：CharXiv ( RQ ) 得分 85.9，为通盘参与对比模子中最高。

纯文本才气方面，官方默示 Qwen3.7-Plus" 合座接近 Max 级别模子 "。

在 Terminal Bench 2.0 上得分 70.3，提高 Opus-4.6 Max（65.4）、K2.6 Thinking（66.7）和 DeepSeek-V4-Pro Max（67.9）。

在 Deep-Planning（复杂多步野心）上得分 62.3，相通最初同级别模子。

不外也有弱项。

在 SWE-Verified（真的软件工程任务）上得分 77.7，低于 Opus-4.6 Max（80.8）和 DeepSeek-V4-Pro Max（80.6）；在 HLE（极难推理）上得分 34.7，低于 GPT-5.4（40.0）。

网友如何看？

Qwen 官方账号 @Alibaba_Qwen 于 6 月 2 日凌晨 1:54 发布公告，趋承 Demo 视频展示了多模态搀杂 Agent 的操作过程。罢休发文，该推文阅读量已达 20 万。

X 网友默示，Qwen3.7-Plus 模子不仅要濒临各式屏幕，还要操作万般器用，并应酬狼藉的责任历程。

还有网友默示，Qwen 此次的布置很了了，便是往 Agent 和 GUI 操控上押注，这个标的目下是对的。

多个网友默示，Qwen 将"看、念念、写、作念"集成于一个模子，着实太通俗了。简直是"集成了一套职工系统！"

联系批驳中，不少技能用户关心的要点贴近在两个标的：

一是 ScreenSpot Pro 的 79 分——这被不少东说念主以为是 "GUI Agent 能否真确商用 " 的重要门槛操办，Qwen3.7-Plus 目下是参测模子中的最高分；

二是 Kernel Bench L3 的 98% ——这个操办臆测的是模子优化 GPU 野心中枢的才气，98% 意味着简直通盘问题都能产出高出 PyTorch 默许编译器的决策。灵验户指出，这个标的曩昔简直是专科工程师的 " 禁区 "。

与 MiniMax M3 的横向对比

两款模子简直同期发布，定位有所不同。

MiniMax M3 主翻开源，技能进展和模子权重欢跃在 10 天内公开，中枢互异化是 1M 超长凹凸文（M3 在 1M 凹凸文下每 token 野心量只须上代的 1/20）和极强的长线程 Agent 才气（147 次 benchmark 提交、1959 次器用调用完成 FP8 矩阵乘优化）。

MiniMax 团队让 M3 孤独复现一篇 ICLR 2025 获奖论文。该任务需要看懂图文、弧线、数据和公式，也需要长凹凸文装入论文、代码和实验日记，还需要编程和 Agent 才气完成复现。M3 自主驱动接近 12 小时，最终跑通中枢实验。

Qwen3.7-Plus 目下仅提供 API 调用，不开源权重，中枢互异化是多模态与 GUI 操作才气的深度整合，以及对主流栽植框架的即插即用兼容性。

两者在编程 Agent 才气上存在奏凯竞争，但侧要点不同：M3 更强调长凹凸文下的自主科研和代码优化才气，Qwen3.7-Plus 更强调视觉感知与界面操作的端到端闭环。

联系衔接：

https://x.com/Alibaba_Qwen/status/2061506641120641494

https://qwen.ai/blog?id=qwen3.7-plus

https://chat.qwen.ai/?models=qwen3.7-plusAG真人国际(中国)官方网站

上一篇：上一篇：AG真人国际(中国)官方网站外卖大战降温，好意思团重回正轨：失掉大幅收窄超预期，外卖客单价和份额回升

下一篇：下一篇：AG真人国际中国官网登录入口设置五年、估值 9650 亿好意思元，Anthropic 刚刚「交表」了

AG国际厅

AG真人国际(中国)官方网站 阿里发布Qwen3.7-Plus：屏幕贯串跑赢GPT-5.4，11小时孤独栽植App，“看、念念、写、作念”买通了！

AG真人国际(中国)官方网站阿里发布Qwen3.7-Plus：屏幕贯串跑赢GPT-5.4，11小时孤独栽植App，“看、念念、写、作念”买通了！