融光 – 开源全流程 AI 视频创作平台,自动化工作流
融光是什么
融光(AI Fusion Video) 是开源的全流程AI视频创作平台,基于Agent架构能实现从剧本编写到视频生成的自动化工作流。平台支持剧本结构化编辑、AI自动分镜拆解、多引擎绘图与视频生成,集成OpenAI、Claude、Gemini等主流大模型,采用Java 21 + Spring Boot 3.5后端与Next.js 16前端技术栈,支持Docker一键部署,帮助内容创作者高效完成视频制作。

融光的主要功能
- 剧本管理:平台能创建和编辑视频剧本,支持分集/分场景结构化管理。
- AI分镜生成:AI自动将剧本拆解为可视化分镜,包含画面描述与镜头语言。
- AI绘图:集成多家AI绘图引擎,一键生成分镜参考图。
- AI视频生成:基于分镜描述和参考图生成视频片段。
- 素材管理:统一管理项目内的图片、视频等素材资源。
- 多模型支持:集成OpenAI、Claude、Gemini、通义千问、DeepSeek、Ollama等主流大模型。
如何使用融光
- 环境准备:安装Docker(推荐方式)或配置JDK 21+、Node.js 20+、pnpm 9+、MySQL与Redis环境。
- 项目获取:执行git clone https://github.com/Stonewuu/ai-fusion-video.git克隆仓库。
- 快速启动:Docker用户直接运行docker compose up -d,源码开发者先启动中间件docker compose -f docker-compose-middleware.yml up -d,再分别启动后端./mvnw spring-boot:run和前端pnpm dev。
- 系统配置:访问http://localhost:8080(Docker)或http://localhost:3000(开发模式),在系统设置页配置AI模型密钥与存储后端。
- 创作流程:创建项目→编写剧本→AI生成分镜→AI绘制参考图→AI生成视频片段→素材导出。
融光的关键信息和使用要求
- 开源协议:MIT License,可自由商用与二次开发。
- 硬件要求:需支持Docker的运行环境或本地JDK 21+运行环境,建议配备充足内存用于AI模型调用。
- 依赖服务:必须配置MySQL数据库与Redis缓存,可选配置对象存储服务。
- API密钥:使用AI功能需自行准备OpenAI、Claude等服务商的API密钥。
- 部署方式:支持Docker Compose一键部署与源码本地开发两种模式。
融光的核心优势
- 全流程自动化:覆盖剧本到成片的完整工作流,减少人工干预环节。
- 多模型兼容:不绑定单一AI服务商,支持主流大模型灵活切换与对比。
- 开源可定制:MIT协议开源,支持私有化部署与深度功能扩展。
- 可视化Agent流程:Pipeline节点可视化展示,创作过程透明可控。
- 分镜驱动生成:以分镜为中间层,确保视频内容与剧本意图保持一致。
融光的项目地址
GitHub仓库:https://github.com/Stonewuu/ai-fusion-video
融光的同类竞品对比
| 对比维度 | 融光 (AI Fusion Video) | HeyGen | Runway Gen-3 |
|---|---|---|---|
| 产品定位 | 开源Agent驱动全流程创作平台 | 云端AI数字人视频生成工具 | 专业AI视频编辑与生成平台 |
| 工作流模式 | 剧本→分镜→图像→视频的多阶段Pipeline | 模板选择→数字人驱动→视频合成 | 素材上传→AI生成→多轨道后期编辑 |
| 可控性 | 高(分镜级精细控制,支持迭代调整) | 中(依赖预设模板与数字人形象) | 中高(运动笔刷、绿幕、相机控制等专业工具) |
| 开源程度 | 完全开源(MIT协议,可私有化部署) | 闭源SaaS服务 | 闭源SaaS服务 |
| 模型支持 | 多厂商兼容(OpenAI/Claude/Gemini/国产模型等) | 自研模型为主 | 自研Gen-3系列模型为主 |
| 适用场景 | 专业创作者全流程管理、团队协作 | 营销视频快速生成、数字人播报 | 影视级广告制作、视觉特效、艺术短片 |
融光的应用场景
- 短视频创作:快速将文案脚本转化为带画面的短视频内容,适合自媒体批量生产。
- 广告营销:根据产品描述自动生成多版本广告分镜与视频素材,加速创意迭代。
- 教育培训:将教学大纲自动拆解为可视化课程片段,降低教育视频制作门槛。
- 影视预演:独立制片人利用AI快速生成故事板与动态预演,验证拍摄方案可行性。
- 动画原型:动画创作者通过AI分镜快速验证叙事节奏与视觉风格。
延伸阅读
-
天禧AI Claw – 联想推出的 AI 智能体助理
天禧AI Claw是什么天禧AI Claw是联想基于OpenClaw架构推出的开箱即用型AI智能体助理,采用端云混合部署模式,支持PC、Phone、Pad多端无缝协同。工具无需本地环境配置即可7×24
-
Qwen3.6-Max-Preview – 阿里通义推出的下一代旗舰模型
Qwen3.6-Max-Preview是什么Qwen3.6-Max-Preview 是阿里通义千问团队推出的下一代旗舰大模型早期预览版。相比 Qwen3.6-Plus,模型在智能体编程、世界知识和指令
-
HyperFrames – HeyGen开源的AI原生视频渲染框架
HyperFrames是什么HyperFrames是HeyGen开源的AI原生视频渲染框架,采用”Write HTML, Render video”理念,专为AI Agent和开发者设计。框架将视频定
关注公众号:拾黑(shiheibook)了解更多
友情链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站:https://www.yaorank.com/
关注网络尖刀微信公众号随时掌握互联网精彩
赞助链接







