新程Alpha是什么新程Alpha是Nextie(明日新程)推出的行业首个认知模型,仅4B参数即可端侧部署。模型由”小冰之父”李笛带队,基于开源推理模型通过强化学习解耦知识与认知,凝练思考算法。模型在
WBench是什么WBench 是美团 LongCat 团队推出的,首个面向交互式视频世界模型的系统性多轮评测基准,包含 289 个测试案例和 1058 个交互轮次,覆盖自然、城市、幻想等 6 类场景
Claude Fable 5是什么Claude Fable 5 是 Anthropic 推出的最强 AI 模型,是 Mythos-class 安全版旗舰模型,底层与Claude Mythos 5 完全
PlanningBench是什么PlanningBench 是腾讯混元团队联合中国人民大学高瓴人工智能学院等机构推出的开源框架,专注于大语言模型的规划能力评测与训练。框架从真实场景出发,构建一套覆盖六
PawBench是什么PawBench 是通义实验室推出的通用智能体评测基准,面向个人助理与 Agent 场景,将底座模型与运行框架(Harness)纳入同一评测体系。PawBench v1.0 构建
Toonflow是什么Toonflow 是开源的一站式 AI 短剧创作工具,将小说、剧本通过多 Agent 协作自动转化为结构化剧本、智能分镜、角色视觉和动画视频,实现小说→剧本→分镜→视频,全流程
BrowserAct Skills是什么BrowserAct Skills 是面向 AI Agent 的浏览器自动化 CLI 工具,能解决 Agent 操控浏览器时的核心痛点,无 Cookie 环境、
JoyAI-Echo是什么JoyAI-Echo 是京东推出的开源长音视频生成框架,专为分钟级多镜头故事生成设计。框架通过跨模态记忆库、记忆驱动后训练、Director Agent 对话式编辑和轻量化实
Gamma-World 是 NVIDIA 推出的多智能体世界模型,能解决多个智能体在同一个模拟世界中平等交互、全局一致的问题。模型创新性地采用单纯形旋转编码保证智能体身份对称,配合稀疏枢纽注意力将通信
Qwen-Image-Bench是什么Qwen-Image-Bench 是通义千问团队推出的文生图模型评测数据集,规模为 1k 条测试样本,覆盖中英双语提示,支持多维度评测各类文生图模型的生成效果,采
PilotDeck是什么PilotDeck 是清华大学THUNLP实验室、面壁智能、OpenBMB与AI9stars联合开源的智能体操作系统。PilotDeck以WorkSpace为核心设计范式,为每
Hy-Memory是什么Hy-Memory 是腾讯混元推出的专为 OpenClaw 等长期协作型 Agent 设计的记忆插件,通过 6 层记忆框架 × System1/System2 双系统 × 演化