热门资讯

OpenSquilla – 开源的微内核 AI Agent 框架，可降低Token成本

业界来源：AI工具集 2026-06-16 11:54:46

OpenSquilla是什么

OpenSquilla是开源、可自托管的Token高效型微内核AI Agent运行时，主打”同样的预算，更高的智能密度”。采用极简微内核架构（核心仅约100行代码），通过本地ML模型路由、自适应推理深度、四层认知记忆系统和按需技能加载，可将Token成本降低60-80%。支持OpenAI、Anthropic、DeepSeek、Gemini等20+主流LLM提供商，内置分层安全沙箱、多通道统一网关（Web/Slack/飞书/钉钉等）及丰富工具集，并提供从OpenClaw和Hermes Agent的迁移工具。

OpenSquilla的主要功能

SquillaRouter 智能路由：本地LightGBM + ONNX分类器，综合消息长度、语言、代码块、关键词和语义嵌入评分，将任务自动路由到T0-T3四个层级的最便宜可用模型，分类过程完全在设备本地完成。
自适应推理深度：仅对复杂查询启用深度推理，简单问题不消耗推理Token；系统Prompt根据任务复杂度自动缩放，避免过度消耗。
多LLM提供商统一接入：支持OpenRouter、OpenAI、Anthropic、Ollama、DeepSeek、Gemini、Qwen/DashScope、Moonshot、Mistral、Groq等20+提供商，支持主模型+备用模型自动切换。
四层认知记忆架构：工作记忆、情景记忆、语义记忆、原始记忆，支持向量语义检索（sqlite-vec）+ BM25关键词搜索 + 记忆自动衰减与”冒泡”晋升 + 梦境模式（空闲时自动凝练新技能候选）。
MetaSkills 可组合工作流：支持可组合工作流编排、meta-skill-creator自助创作、10+内置与N+社区Skills自动检索，支持Replay回放与Dream模式自我进化。
分层安全沙箱：Standard/Strict/Locked三档策略，Linux下使用Bubblewrap系统调用级隔离（CPU/内存/时长/网络），无需Docker即可部署到Serverless环境。
统一网关与多通道接入：基于Starlette ASGI的本地网关（默认127.0.0.1:18791），Web UI、CLI、Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix等共享同一TurnRunner循环。
丰富内置工具集：文件读写编辑、Shell与后台进程、Git、网页搜索（Brave/DuckDuckGo）、SSRF防护、PPT/Word/Excel/PDF生成、图像生成、TTS等。
成本追踪与配额管理：每轮/每会话Token与费用汇总，内置配额钩子可自动节流防超支，实现精细化成本控制。
微内核插件架构：核心编排器仅约100行代码，负责状态机与管道编排；所有能力（Provider、Memory、Channels、Tools、Sandbox等）均以插件形式运行在”用户空间”，插件崩溃不影响核心。

微信关注回复 “开源”，加入AI开源项目交流群

如何使用OpenSquilla

环境准备与安装：确保系统已安装 Python 3.12+，通过 uv 工具一键安装 OpenSquilla（当前版本 0.3.1），支持 Windows、macOS、Linux 全平台。
初始化配置：运行 opensquilla onboard 完成首次引导配置，包括设置默认 LLM 提供商、API Key、记忆存储路径及安全沙箱策略（Standard/Strict/Locked）。
启动本地网关：执行 opensquilla gateway run 启动基于 Starlette ASGI 的统一网关，默认监听 127.0.0.1:18791，浏览器访问 http://127.0.0.1:18791/control/ 进入 Web 控制台。
配置多 LLM 提供商：在控制台或配置文件中添加 OpenAI、Anthropic、DeepSeek、Gemini、Qwen、Moonshot 等 20+ 提供商的 API Key，设置主模型与备用模型，启用 SquillaRouter 自动路由。
通过 Web UI 交互：在控制台直接输入任务，系统自动完成模型路由、推理深度判断、记忆检索和工具调用，实时查看每轮 Token 消耗与费用。
接入多通道平台：配置 Slack、Discord、Telegram、飞书、钉钉、企业微信、QQ、Matrix 等通道的 Webhook 或 Bot Token，实现多平台共享同一 Agent 能力。
使用与创作 MetaSkills：调用内置 Skills 处理常见任务，或通过 meta-skill-creator 自助创作可组合工作流；启用 Dream 模式让系统在空闲时自动凝练新技能候选。
管理记忆与上下文：系统自动维护工作记忆、情景记忆、语义记忆、原始记忆四层架构；支持手动查看、编辑记忆条目，配置自动衰减与冒泡晋升策略。
配置安全沙箱：Linux 环境下启用 Bubblewrap 系统调用级隔离，限制 CPU、内存、执行时长和网络访问，无需 Docker 即可安全执行 Shell 和文件操作。
监控与配额管理：在控制台查看每轮/每会话的 Token 与费用汇总，设置配额阈值自动节流，防止预算超支。
数据迁移（可选）：如从 OpenClaw 或 Hermes Agent 迁移，使用官方迁移工具导入记忆、人格文件、Skills 和通道配置，预览并处理冲突项。

OpenSquilla的官网地址

项目官网：https://opensquilla.ai/zh/ 或 https://opensquilla.ai/
GitHub仓库：https://github.com/opensquilla/opensquilla

OpenSquilla的核心优势

Token成本降低60-80%：通过本地ML智能路由、自适应推理深度、Prompt自动缩放和按需技能加载，在同等预算下实现更高的智能密度。
极简微内核架构：核心编排器仅约100行代码，所有能力以插件形式运行在用户空间，单个插件崩溃不影响核心，核心升级不破坏插件。
本地智能模型路由：SquillaRouter基于LightGBM+ONNX分类器在设备本地完成评分，自动将任务分配到T0-T3四个层级的最便宜可用模型，零云端路由开销。
四层认知记忆系统：工作记忆、情景记忆、语义记忆、原始记忆分层管理，支持向量检索+BM25关键词搜索+自动衰减与”冒泡”晋升，记忆越用越精准。
自适应推理与Prompt：仅对复杂查询启用深度推理，简单问题零推理Token消耗；系统Prompt根据任务复杂度自动缩放，避免过度调用。
系统级安全沙箱：Linux下采用Bubblewrap实现CPU/内存/时长/网络的系统调用级隔离，无需Docker即可安全部署到Serverless环境。
多通道统一网关：基于Starlette ASGI的本地网关，Web UI、CLI、Slack、Discord、Telegram、飞书、钉钉、企业微信等共享同一TurnRunner循环，一次部署全平台覆盖。
MetaSkills自我进化：支持可组合工作流、自助创作与社区自动检索，配合梦境模式在空闲时自动凝练新技能候选，实现Agent能力的持续进化。

OpenSquilla的同类竞品对比

维度	OpenSquilla	OpenClaw	Hermes Agent
架构	微内核，5层分离，核心极简，插件自动跳过+回滚	插件生态成熟，但层级偏多	单体同步主循环，逻辑紧耦合
成本优化	ML路由+推理分级+Prompt缓存+按需技能，省60-80%	配置文件写死主备模型链，不会自动选	仅靠关键词+字数粗糙判断，单一路由
MetaSkills	可组合工作流+自助创作+社区自动检索+梦境进化	Prompt串联的skill chain，无meta-protocol层	无复用工作流抽象，每次从零重写
记忆系统	向量+关键词+去重+衰减+冒泡+自动迁移	有衰减/冒泡/多样性重排，但缺四层认知结构	仅关键词搜索，语义记忆需外挂
安全沙箱	系统调用级隔离，无需Docker，适合Serverless	Docker可选，OpenShell较轻但仍重	危险命令审批+6种执行环境
成本追踪	实际每调用成本+配额自动节流	内置定价表，成本写入会话元数据	输入/输出/缓存/推理Token分开追踪

OpenSquilla的应用场景

个人与开发者低成本AI助手：用SquillaRouter智能路由和自适应推理，将Token成本降低60-80%，适合预算有限的个人开发者、独立创作者或学生作为日常编程、写作、问答的AI助手。
企业多平台智能客服与办公助手：通过统一网关同时接入飞书、钉钉、企业微信、Slack、Discord等多通道，一套Agent能力覆盖全公司沟通平台，自动处理内部咨询、工单流转和知识问答。
高敏感数据场景的私有化AI部署：支持完全自托管与本地运行，四层记忆数据存储在本地，配合Bubblewrap系统级安全沙箱，适合金融、医疗、法律等对数据隐私和合规要求极高的行业。
自动化工作流与任务编排：借助MetaSkills可组合工作流和内置工具集（文件编辑、Git、网页搜索、文档生成），实现报告自动生成、代码审查、数据抓取、PPT/Excel批量处理等重复性工作的自动化。
多模型策略管理与A/B测试：同时接入20+ LLM提供商并配置主备模型，企业可根据任务复杂度动态分配模型资源，也可用于不同模型间的效果对比与成本优化实验。
Serverless与边缘计算部署：微内核架构轻量，安全沙箱无需Docker即可运行，适合部署在Serverless函数计算或边缘设备上，作为低资源占用的嵌入式AI服务。