OpenSquilla – 开源的微内核 AI Agent 框架,可降低Token成本

业界 来源:AI工具集 2026-06-16 11:54:46

OpenSquilla是什么

OpenSquilla是开源、可自托管的Token高效型微内核AI Agent运行时,主打”同样的预算,更高的智能密度”。采用极简微内核架构(核心仅约100行代码),通过本地ML模型路由、自适应推理深度、四层认知记忆系统和按需技能加载,可将Token成本降低60-80%。支持OpenAI、Anthropic、DeepSeek、Gemini等20+主流LLM提供商,内置分层安全沙箱、多通道统一网关(Web/Slack/飞书/钉钉等)及丰富工具集,并提供从OpenClaw和Hermes Agent的迁移工具。

OpenSquilla的主要功能

  • SquillaRouter 智能路由:本地LightGBM + ONNX分类器,综合消息长度、语言、代码块、关键词和语义嵌入评分,将任务自动路由到T0-T3四个层级的最便宜可用模型,分类过程完全在设备本地完成。
  • 自适应推理深度:仅对复杂查询启用深度推理,简单问题不消耗推理Token;系统Prompt根据任务复杂度自动缩放,避免过度消耗。
  • 多LLM提供商统一接入:支持OpenRouter、OpenAI、Anthropic、Ollama、DeepSeek、Gemini、Qwen/DashScope、Moonshot、Mistral、Groq等20+提供商,支持主模型+备用模型自动切换。
  • 四层认知记忆架构:工作记忆、情景记忆、语义记忆、原始记忆,支持向量语义检索(sqlite-vec)+ BM25关键词搜索 + 记忆自动衰减与”冒泡”晋升 + 梦境模式(空闲时自动凝练新技能候选)。
  • MetaSkills 可组合工作流:支持可组合工作流编排、meta-skill-creator自助创作、10+内置与N+社区Skills自动检索,支持Replay回放与Dream模式自我进化。
  • 分层安全沙箱:Standard/Strict/Locked三档策略,Linux下使用Bubblewrap系统调用级隔离(CPU/内存/时长/网络),无需Docker即可部署到Serverless环境。
  • 统一网关与多通道接入:基于Starlette ASGI的本地网关(默认127.0.0.1:18791),Web UI、CLI、Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix等共享同一TurnRunner循环。
  • 丰富内置工具集:文件读写编辑、Shell与后台进程、Git、网页搜索(Brave/DuckDuckGo)、SSRF防护、PPT/Word/Excel/PDF生成、图像生成、TTS等。
  • 成本追踪与配额管理:每轮/每会话Token与费用汇总,内置配额钩子可自动节流防超支,实现精细化成本控制。
  • 微内核插件架构:核心编排器仅约100行代码,负责状态机与管道编排;所有能力(Provider、Memory、Channels、Tools、Sandbox等)均以插件形式运行在”用户空间”,插件崩溃不影响核心。

微信关注回复 “开源”,加入AI开源项目交流群

如何使用OpenSquilla

  • 环境准备与安装:确保系统已安装 Python 3.12+,通过 uv 工具一键安装 OpenSquilla(当前版本 0.3.1),支持 Windows、macOS、Linux 全平台。
  • 初始化配置:运行 opensquilla onboard 完成首次引导配置,包括设置默认 LLM 提供商、API Key、记忆存储路径及安全沙箱策略(Standard/Strict/Locked)。
  • 启动本地网关:执行 opensquilla gateway run 启动基于 Starlette ASGI 的统一网关,默认监听 127.0.0.1:18791,浏览器访问 http://127.0.0.1:18791/control/ 进入 Web 控制台。
  • 配置多 LLM 提供商:在控制台或配置文件中添加 OpenAI、Anthropic、DeepSeek、Gemini、Qwen、Moonshot 等 20+ 提供商的 API Key,设置主模型与备用模型,启用 SquillaRouter 自动路由。
  • 通过 Web UI 交互:在控制台直接输入任务,系统自动完成模型路由、推理深度判断、记忆检索和工具调用,实时查看每轮 Token 消耗与费用。
  • 接入多通道平台:配置 Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix 等通道的 Webhook 或 Bot Token,实现多平台共享同一 Agent 能力。
  • 使用与创作 MetaSkills:调用内置 Skills 处理常见任务,或通过 meta-skill-creator 自助创作可组合工作流;启用 Dream 模式让系统在空闲时自动凝练新技能候选。
  • 管理记忆与上下文:系统自动维护工作记忆、情景记忆、语义记忆、原始记忆四层架构;支持手动查看、编辑记忆条目,配置自动衰减与冒泡晋升策略。
  • 配置安全沙箱:Linux 环境下启用 Bubblewrap 系统调用级隔离,限制 CPU、内存、执行时长和网络访问,无需 Docker 即可安全执行 Shell 和文件操作。
  • 监控与配额管理:在控制台查看每轮/每会话的 Token 与费用汇总,设置配额阈值自动节流,防止预算超支。
  • 数据迁移(可选):如从 OpenClaw 或 Hermes Agent 迁移,使用官方迁移工具导入记忆、人格文件、Skills 和通道配置,预览并处理冲突项。

OpenSquilla的官网地址

  • 项目官网:https://opensquilla.ai/zh/ 或 https://opensquilla.ai/

  • GitHub仓库:https://github.com/opensquilla/opensquilla

OpenSquilla的核心优势

  • Token成本降低60-80%:通过本地ML智能路由、自适应推理深度、Prompt自动缩放和按需技能加载,在同等预算下实现更高的智能密度。
  • 极简微内核架构:核心编排器仅约100行代码,所有能力以插件形式运行在用户空间,单个插件崩溃不影响核心,核心升级不破坏插件。
  • 本地智能模型路由:SquillaRouter基于LightGBM+ONNX分类器在设备本地完成评分,自动将任务分配到T0-T3四个层级的最便宜可用模型,零云端路由开销。
  • 四层认知记忆系统:工作记忆、情景记忆、语义记忆、原始记忆分层管理,支持向量检索+BM25关键词搜索+自动衰减与”冒泡”晋升,记忆越用越精准。
  • 自适应推理与Prompt:仅对复杂查询启用深度推理,简单问题零推理Token消耗;系统Prompt根据任务复杂度自动缩放,避免过度调用。
  • 系统级安全沙箱:Linux下采用Bubblewrap实现CPU/内存/时长/网络的系统调用级隔离,无需Docker即可安全部署到Serverless环境。
  • 多通道统一网关:基于Starlette ASGI的本地网关,Web UI、CLI、Slack、Discord、Telegram、飞书、钉钉、企业微信等共享同一TurnRunner循环,一次部署全平台覆盖。
  • MetaSkills自我进化:支持可组合工作流、自助创作与社区自动检索,配合梦境模式在空闲时自动凝练新技能候选,实现Agent能力的持续进化。

OpenSquilla的同类竞品对比

维度OpenSquillaOpenClawHermes Agent
架构微内核,5层分离,核心极简,插件自动跳过+回滚插件生态成熟,但层级偏多单体同步主循环,逻辑紧耦合
成本优化ML路由+推理分级+Prompt缓存+按需技能,省60-80%配置文件写死主备模型链,不会自动选仅靠关键词+字数粗糙判断,单一路由
MetaSkills可组合工作流+自助创作+社区自动检索+梦境进化Prompt串联的skill chain,无meta-protocol层无复用工作流抽象,每次从零重写
记忆系统向量+关键词+去重+衰减+冒泡+自动迁移有衰减/冒泡/多样性重排,但缺四层认知结构仅关键词搜索,语义记忆需外挂
安全沙箱系统调用级隔离,无需Docker,适合ServerlessDocker可选,OpenShell较轻但仍重危险命令审批+6种执行环境
成本追踪实际每调用成本+配额自动节流内置定价表,成本写入会话元数据输入/输出/缓存/推理Token分开追踪

OpenSquilla的应用场景

  • 个人与开发者低成本AI助手:用SquillaRouter智能路由和自适应推理,将Token成本降低60-80%,适合预算有限的个人开发者、独立创作者或学生作为日常编程、写作、问答的AI助手。
  • 企业多平台智能客服与办公助手:通过统一网关同时接入飞书、钉钉、企业微信、Slack、Discord等多通道,一套Agent能力覆盖全公司沟通平台,自动处理内部咨询、工单流转和知识问答。
  • 高敏感数据场景的私有化AI部署:支持完全自托管与本地运行,四层记忆数据存储在本地,配合Bubblewrap系统级安全沙箱,适合金融、医疗、法律等对数据隐私和合规要求极高的行业。
  • 自动化工作流与任务编排:借助MetaSkills可组合工作流和内置工具集(文件编辑、Git、网页搜索、文档生成),实现报告自动生成、代码审查、数据抓取、PPT/Excel批量处理等重复性工作的自动化。
  • 多模型策略管理与A/B测试:同时接入20+ LLM提供商并配置主备模型,企业可根据任务复杂度动态分配模型资源,也可用于不同模型间的效果对比与成本优化实验。
  • Serverless与边缘计算部署:微内核架构轻量,安全沙箱无需Docker即可运行,适合部署在Serverless函数计算或边缘设备上,作为低资源占用的嵌入式AI服务。
延伸阅读

关注公众号:拾黑(shiheibook)了解更多

友情链接:

关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接