Step 3.7 Flash – 阶跃星辰开源的新一代 Flash 模型
Step 3.7 Flash是什么
Step 3.7 Flash 是阶跃星辰面向 Agent 生产化阶段推出的新一代开源 Flash 模型,采用稀疏 MoE 架构,最高生成速度达 400 Tokens/s。模型围绕 Agent、Coding、Search 与多模态工作流进行系统优化,在速度、成本、可靠执行和复杂任务完成能力之间取得平衡,为开发者构建生产级 Agent 的高效率基座模型。

Step 3.7 Flash的主要功能
- 原生多模态理解与执行:原生理解 UI、图表、文档、图片和应用界面,将复杂视觉信息转化为结构化结果、代码生成和可执行任务,支持自主裁剪、放大、重读图像。
- 联网与视觉搜索增强:强化联网检索与图像搜索,在开放信息环境中跨文本与图像主动获取并交叉比对多源证据。
- 高可靠工具调用与编排:在长程多轮 Agent 工作流中稳定调用 API、浏览器、终端、Office 工具和外部系统,保持任务轨迹一致。
- Agent 生态兼容优化:针对 Claude Code、KiloCode、RooCode、OpenCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP/Skills 协议进行兼容适配。
- 本地与云端双部署:支持云端 API 调用,同时针对个人工作站本地部署优化,提供 GGUF 多精度端侧版本。
Step 3.7 Flash的技术原理
- 稀疏 MoE 架构:总参数 196B + 1.8B(ViT),激活参数仅 11B,实现模型能力与推理成本的更优平衡。
- 视觉感知-搜索-推理融合:将视觉感知、搜索与推理过程深度结合,面对复杂视觉问题时主动发起搜索进行交叉验证。
- 长程任务轨迹保持:在多轮 Agent 工作流中通过优化保持任务轨迹一致性,降低跑偏和执行失败率。
- 多精度端侧优化:提供 GGUF 格式支持,适配不同硬件资源的本地部署需求。
如何使用Step 3.7 Flash
云端接入
国内开放平台 API:访问 https://platform.stepfun.com注册账号,获取 API Key 后即可通过标准接口调用模型能力。
海外开放平台 API:访问 https://platform.stepfun.ai 进行海外节点接入,适合国际业务场景。
Studio 在线体验:进入 https://studio.stepfun.com/ 无需配置即可在网页端直接体验模型对话与多模态能力。
开源部署
GitHub 仓库:前往 https://github.com/stepfun-ai/Step-3.7-Flash下载完整代码与权重,按文档完成本地或服务器部署。
Huggingface 模型:在 https://huggingface.co/stepfun-ai/Step-3.7-Flash获取模型文件,支持 Transformers 等主流框架直接加载推理。
Modelscope 模型:通过https://modelscope.cn/models/stepfun-ai/Step-3.7-Flash下载,适合国内开发者快速拉取。
端侧 GGUF 版本:访问 https://huggingface.co/stepfun-ai/Step-3.7-Flash-GGUF 获取多精度量化版本,可在个人工作站甚至低配置设备上流畅运行。
应用端与生态
阶跃 AI App:下载阶跃 AI 移动端应用,直接在手机上体验 Step 3.7 Flash 的问答与 Agent 能力。
Agent 框架接入:在 Kilo Code、Nous Research(Hermes Agent)等已验证的 Agent 工具中配置 Step 3.7 Flash 的 API 端点,可作为底层模型驱动 Coding 与自动化工作流。
Step 3.7 Flash的核心优势
- 极速推理:单请求最高 400 TPS,适合高频、多轮、低等待的 Agent 应用。
- 激活参数极低:仅 11B 激活参数,推理成本大幅降低,性价比极高。
- 生产级可靠性:在 Toolathlon(49.5%)、ClawEval-1.1(67.1%)、GDPval(45.8%)等真实环境基准中表现稳定。
- 多模态深度理解:在 SimpleVQA(79.2%)、V*(95.3%)等复杂视觉任务上媲美更大规模旗舰模型。
- 生态即插即用:针对主流 Agent 框架和 MCP/Skills 协议预优化,降低接入成本。
Step 3.7 Flash的项目地址
项目官网:https://static.stepfun.com/blog/step-3.7-flash/
GitHub仓库:https://github.com/stepfun-ai/Step-3.7-Flash
HuggingFace模型库:https://huggingface.co/stepfun-ai/Step-3.7-Flash
Step 3.7 Flash的同类竞品对比
| 对比维度 | Step 3.7 Flash | Step 3.5 Flash | Gemini 2.5 Flash |
|---|---|---|---|
| 架构 | 稀疏 MoE,196B/11B 激活 | 前代 Flash 架构 | 未知 |
| 最高速度 | 400 TPS | 较低 | 较高 |
| SWE-Bench Pro | 56.3 | 51.3 | 55.6 |
| Terminal-Bench 2.1 | 59.5 | 53.4 | 62.0 |
| SimpleVQA (Tool) | 79.2 | 78.2 | 78.2 |
| V (Python)* | 95.3 | 89.0 | 96.9 |
| ClawEval-1.1 | 67.1 | 43.6 | 57.8 |
| Toolathlon | 49.5 | 33.3 | 52.8 |
| HLE (Tool) | 47.2 | 35.7 | 45.1 |
| 开源 | ✅ 完全开源 | ✅ 开源 | ❌ 闭源 |
Step 3.7 Flash的应用场景
- Coding Agent:在 SWE-Bench Pro 和 Terminal-Bench 中表现突出,可稳定执行代码生成、调试、终端操作等开发任务。
- 多模态知识工作:自动理解 UI 界面、图表、文档,生成结构化分析或操作指引,适用于产品分析、设计评审、软件教程生成。
- 企业流程自动化:通过稳定调用 API、Office 工具和外部系统,嵌入企业工作流执行数据录入、报表生成、跨系统操作。
- 视觉搜索与验证:在信息不确定时主动发起图像搜索和交叉验证,适用于电商比价、内容审核、事实核查。
-
Qwen-Image-Bench – 通义千问推出的文生图模型评测基准
Qwen-Image-Bench是什么Qwen-Image-Bench 是通义千问团队推出的文生图模型评测数据集,规模为 1k 条测试样本,覆盖中英双语提示,支持多维度评测各类文生图模型的生成效果,采
-
PilotDeck – 清华联合面壁智能开源的 Agent 操作系统
PilotDeck是什么PilotDeck 是清华大学THUNLP实验室、面壁智能、OpenBMB与AI9stars联合开源的智能体操作系统。PilotDeck以WorkSpace为核心设计范式,为每
-
Hy-Memory – 腾讯混元推出的 Agent 记忆插件
Hy-Memory是什么Hy-Memory 是腾讯混元推出的专为 OpenClaw 等长期协作型 Agent 设计的记忆插件,通过 6 层记忆框架 × System1/System2 双系统 × 演化
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/







关注网络尖刀微信公众号