SceneGen是什么SceneGen是上海交通大学研究团队开发的高效开源3D场景生成框架。能从单张场景图像及其对应的物体分割掩码出发,通过一次前向传播,直接生成包含完整几何结构、纹理和空间布局的3D
Agent Kit是什么Agent Kit 是 OpenAI 推出的一套完整的智能体开发工具包,帮助开发者将 AI 代理从原型快速推进至生产环境。包含三大核心组件:Agent Builder可视化画布
Ming-UniAudio是什么Ming-UniAudio 是蚂蚁集团开源的音频多模态模型,统一语音理解、生成和编辑任务。核心是 MingTok-Audio,一个基于 VAE 框架和因果 Transf
Qwen3-LiveTranslate是什么Qwen3-LiveTranslate 是阿里通义团队推出的基于大语言模型的多语言实时音视频同传模型。模型支持 18 种语言及多种方言的翻译,具备视觉增强技
Qwen3-VL是什么Qwen3-VL 是阿里通义推出的 Qwen 系列中最强大的视觉语言模型,具备卓越的多模态能力。模型能理解纯文本、图像和视频,支持长上下文、空间感知、代码生成等功能。Qwen3-
Qwen3-Max是什么Qwen3-Max 是 Qwen 团队推出的超大规模语言模型,参数量超过 1T,预训练使用 36T tokens。Qwen3-Max是目前 Qwen 系列中规模最大、能力最强的
presentation-ai是什么presentation-ai 是ALLWEONE团队推出的开源 AI 演示文稿生成工具,能根据用户输入的主题自动生成完整的 PPT 大纲和精美的幻灯片,支持多种语
Qwen3Guard是什么Qwen3Guard 是阿里通义团队推出的 Qwen 家族中首款专为安全防护设计的护栏模型,基于强大的 Qwen3 基础架构打造。模型针对安全分类任务进行专项微调,能高效识别
Doubao-Seed-Translation是什么Doubao-Seed-Translation 是字节跳动团队推出的先进多语言翻译模型,支持 28 种语言互译,涵盖中英、日韩、德法等多种常用语言。
点点是什么点点是小红书推出的AI搜索助手,主打生活服务场景的聚合搜索。提供生活搜索助手功能,能贴心地帮助用户找到并总结出日常生活中遇到的问题的答案。具有“哪里不‘会’点哪里”的功能,支持用户在回答中点
OpenLens AI是什么OpenLens AI 是清华大学自动化系推出的专为医学研究设计的全自主人工智能研究助手,通过多智能体协作,实现从文献综述、实验设计、数据分析到论文生成的全流程自动化,极大
LONGLIVE是什么LONGLIVE 是英伟达等顶尖机构联合推出的实时交互式长视频生成框架。框架通过帧级自回归(AR)模型,结合 KV-recache 机制、流式长视频微调和短窗口注意力 + 帧汇入