用一句话生成一部电影:OpenMontage 把 AI 编码助手变成了视频工作室
你告诉你的 AI 编码助手:”做一个 60 秒的科普视频,讲神经网络怎么学习。”
然后去喝杯咖啡。回来的时候,脚本写好了、画面生成完了、旁白录好了、字幕加上了、背景音乐配好了——一整个视频躺在你的文件夹里,花费不到 1 块钱。
这不是科幻片,这是本周刚冲上 3 万星的 OpenMontage。

OpenMontage 是什么
OpenMontage 把自己定义为 **”全球首个开源 Agent 视频制作系统”**。有点绕,翻译成人话就是:
把你的 AI 编码助手(Claude Code、Cursor、Copilot 等)变成一个完整的视频工作室。你用自然语言描述需求,Agent 自动完成调研、脚本、素材生成、剪辑、合成所有步骤。

不是那种”把几张图片串起来配个音乐”的幻灯片工具。它是真家伙——12 条流水线(Pipeline)、52 个工具、500+ Agent 技能,可以做到:
- 用真实素材剪辑纪实短片(通过 Archive.org、NASA、Wikimedia 等免费素材库)
- 用 AI 生成图像做动画短片(FLUX、DALL-E)
- 用 Kling、Veo、MiniMax 生成视频片段
- 自动配音(Piper TTS 离线免费,或 ElevenLabs、Google TTS)
- 自动配乐(自动找免版税音乐)
- 加字幕后渲染成片
而且所有步骤都是 Agent 自动协调的,不是你在 ComfyUI 里拖节点。
几个开箱即用的 Demo
🎬 “最后的香蕉” — 60 秒皮克斯风动画
一只孤独的香蕉和一顆猕猴桃成了朋友。6 段 Kling v3 生成的运动剪辑(通过 fal.ai)、Google Chirp3 旁白、免版税钢琴配乐、TikTok 风格逐字字幕。总成本:$1.33。
🏛️ “亚历山大图书馆” — 70 秒历史挽歌
对亚历山大图书馆毁灭之夜的沉痛追忆。5 个手写场景、OpenAI TTS 旁白、免版税弦乐配乐、全场逐字字幕。总成本:$0.02。
💻 “VOID — 神经接口” — 产品广告
只用了一个 API Key(OpenAI),就做出了完整的 AI 产品宣传片:4 张 AI 图片、TTS 旁白、自动配乐、逐字字幕、数据可视化动画。总成本:$0.69。零人工素材工作。
🍭 “糖果乐园的午后” — 吉卜力风动画
12 张 FLUX 图片合成的宫崎骏风格动画短片。多次交叉淡入淡出、推拉摇移运镜、粒子特效叠加、自动检测节奏的背景音乐。总成本:$0.15。没用到视频生成,纯图片 + Remotion 动画。
为什么它值得关注
1. 不是”套壳”——是真·Agent 视频制作
很多所谓的 AI 视频工具只是调个 API 生图,然后手动剪辑。OpenMontage 的核心是 Agent 工作流:research → proposal → script → scene_plan → assets → edit → compose,每个阶段都有专门的 “导演技能”(一个 markdown 指令文件),Agent 读指令、调工具、自审、交付。
而且每一条流水线的参数选择都经过 7 维评分,有可审计的决策日志。
2. 是真的”免费可用”
不需要充 API 余额也能跑:
- 配音:Piper TTS(免费离线)
- 素材:Archive.org + NASA + Wikimedia(免费开源影像)
- 补充素材:Pexels + Unsplash + Pixabay(开发者 Key 免费)
- 渲染合成:Remotion(React 动画引擎)或 HyperFrames(HTML/GSAP)
有 GPU 的话,还可以跑本地视频生成模型(Wan2.1、Hunyuan、CogVideo)。
3. 从参考视频到成品,支持”给个样片”
粘贴一个 YouTube Short 或 TikTok 链接,Agent 自动分析脚本节奏、镜头、风格,然后给你 2-3 个差异化方案——不是”猜一个 prompt”,而是告诉你哪些保留了、哪些改了、预算多少、成品大概长什么样。
为什么它涨这么猛
从 6 月 25 号的 ~3700 星到 7 月 1 号的 30,055 星,一周不到暴涨 8 倍。
原因我觉得很清晰:
- 时机对了。Claude Code 和 Cursor 的用户基数在疯长,这些人天然就是 OpenMontage 的目标用户——你已经有 Agent 编码助手了,现在让它帮你做视频
- 打开了想象空间。”让你的编码助手做视频”这个组合,比单纯”AI 视频工具”有吸引力得多
- 结果可复现。每个 demo 视频都公开了完整 prompt、流水线、工具列表和成本,你不是在看画饼
- 零门槛体验。
git clone && make setup就能跑,支持本地或云端
怎么上手
1 | git clone https://github.com/calesthio/OpenMontage.git |
然后打开你的 AI 编码助手,告诉它你想做什么。
比如:
“Make a 45-second animated explainer about why the sky is blue”
“Create a 60-second video about the history of the internet, with narration and captions”
“Make a 90-second documentary montage about what a city feels like at 4am. Use real footage only, no narration, elegiac tone.”
OpenMontage 目前支持所有主流 AI 编码助手:Claude Code、Cursor、Copilot、Windsurf、Codex。
一点思考
OpenMontage 让我最感慨的不是它能做视频(这迟早会来),而是 它展示了一种新的产品范式:不是做一个面向用户的视频编辑器,而是做一个面向 Agent 的视频制作系统。
它的文档里有一段话特别有意思:
“This repo is built for agentic operation. Treat every video request as a pipeline selection problem.”
意思是说,设计这套系统时的第一用户不是人,是 AI Agent。12 条流水线、500+ 技能、52 个工具——都是在给 Agent 构建一个”视频制作的操作系统”。
当所有人还在卷 AI 视频生成模型的时候,OpenMontage 在卷另外一层:如何让 Agent 像一个真正的视频导演一样工作。
这可能是比视频生成本身更值得关注的趋势。
数据来源
- GitHub: calesthio/OpenMontage — 30,055 ⭐ (2026-07-01)
- 许可证: AGPL-3.0 | 语言: Python
- YouTube: @OpenMontage
本文标题:用一句话生成一部电影:OpenMontage 把 AI 编码助手变成了视频工作室
文章作者:AwesomeYang
发布时间:2026-07-01
最后更新:2026-07-02
原始链接:https://awesomeyang.com/2026/07/01/openmontage-agent-video-production/
版权声明:未经允许禁止转载,请关注公众号联系作者
