阿里通义千问 Qwen3-4B-2507 双料更新：手机也能轻松跑，AI 体积小、性能强

webmaster

八月 6, 2025 - 21:46

0 0

阿里通义千问 Qwen3-4B-2507 双料更新：手机也能轻松跑，AI 体积小、性能强

IT之家 8 月 7 日消息，通义千问 Qwen 昨日（8 月 6 日）发布公告，宣布，推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两个模型，大幅提升性能。

官方表示，SLM（Small Language Models）对 Agentic AI 的发展极具价值，“2507”版本的 Qwen3-4B 模型，体积小，性能强，对手机等端侧硬件部署尤为友好。

IT之家援引博文介绍，在非推理（non-thinking）领域，Qwen3-4B-Instruct-2507 显著提升通用能力，目标成为更全能的端侧利器。

该模型掌握更多语言和长尾知识，上下文理解扩展至 256K，小模型也能处理长文本。该模型通用能力超越了闭源的小尺寸模型 GPT-4.1-nano，性能接近等规模的 Qwen3-30B-A3B（non-thinking）。

官方表示该模型更像一位高效的“执行专家”，遵循指令、迅速响应，更适合用于内容创作、工具调用等。

在推理（thinking）领域，Qwen3-4B-Thinking-2507 大幅提升了推理能力，AIME25 高达 81.3 分。Qwen3-4B-Thinking-2507 的推理表现可媲美中等模型 Qwen3-30B-Thinking，在聚焦数学能力的 AIME25 测评中，以 4B 参数量斩获惊人的 81.3 分的好成绩。

官方表示该模型像一位严谨的“学术专家”，面对复杂问题逐步推理，完成任务更深入可靠。

你的反应是什么？

喜欢 0

不喜欢 0

喜爱 0

有趣 0

愤怒 0

悲伤 0

哇 0

webmaster

相关帖子

Counterpoint：SK 海力士 2025 年二季度存储营收追上三星电子

Counterpoint：SK 海力士 2025 年二季度存储营收追上三星电子

webmaster 7月 8, 2025 0 0

普华永道：十年后全球 1/3 半导体产能依赖对气候变化敏感的铜供应

普华永道：十年后全球 1/3 半导体产能依赖对气候变化敏感的...

webmaster 7月 8, 2025 0 0

零百 3.4 秒，全新阿斯顿・马丁 Vantage S 超跑官图发布

零百 3.4 秒，全新阿斯顿・马丁 Vantage S 超跑官图发布

webmaster 7月 8, 2025 0 0

微软邀请测试新版 Excel：数据获取更直观

微软邀请测试新版 Excel：数据获取更直观

webmaster 7月 8, 2025 0 0

微软 Win11 23H2/22H2 推送 7 月累积更新：引入 PC 迁移工具等

微软 Win11 23H2/22H2 推送 7 月累积更新：引入 PC 迁移工具等

webmaster 7月 8, 2025 0 0

2026 款零跑 C11 车型明日上市：预售 15.88 万元起，纯电、增程双版本

2026 款零跑 C11 车型明日上市：预售 15.88 万元起，纯电、...

webmaster 7月 8, 2025 0 0