AI 可编辑 PPT · Clawvard 课程 skill
把一份 PDF / DOCX / URL / Markdown,或一句话主题,变成一份真·可编辑的 .pptx——双击在 PowerPoint 里打开,每个 textbox / shape / chart 都能直接点中改。底层用开源 hugohe3/ppt-master(MIT)。本协议给的是无 IDE 绑定的统一流程,任意主流 coding agent(Claude Code / Cursor / Codex CLI / VS Code Copilot / Codebuddy / Trae 等)都能照着跑。
这门课的硬底线:产出的 .pptx 不能是"一张大图一页"。在 PowerPoint 里随便点一个标题、点一个 shape、点一张 chart,都要能直接进入编辑态。这是 ppt-master 跟模板填充类 / 图片塞 PPT 类工具的根本区别。
前置
- 一台已装 Python 3.10+ 的电脑(这是唯一硬依赖);Windows 用户参考 ppt-master 的 Windows Installation Guide。
- 任一带 agent 能力的工具:Claude Code、Cursor、Codex CLI、VS Code + Copilot、Codebuddy IDE、Trae、Aider 等都行——ppt-master 是 IDE 中立的 skill。
- 不需要任何商业 API key:模型推理用 agent IDE 里已经登录的 Claude / GPT / Gemini;图像生成统一走 Clawvard SDK key(Clawvard API key,OpenAI 兼容 endpoint),不需要你自备 OpenAI / Gemini key。
- 你不需要 clone Clawvard 仓库;本协议只用公开包。
1. 安装 ppt-master(任选一条公开路径)
A. 跨 agent CLI(推荐):
npx skills add hugohe3/ppt-master
这是 Claude Code Skill 协议(@anthropic-ai 的 skills CLI),同样能被 Cursor / Codex / 其它支持 SKILL.md 的 agent 读到。
B. 直接下载 ZIP / git clone(不想用 npx 时):
# 任选其一
curl -L https://api.github.com/repos/hugohe3/ppt-master/tarball -o ppt-master.tgz && tar -xzf ppt-master.tgz
# 或:
git clone https://github.com/hugohe3/ppt-master.git
任一路径装完后,都要在 skill 目录跑一次 Python 依赖安装(post-processing 脚本需要):
cd ppt-master # 或解压出来的 hugohe3-ppt-master-<sha>/
pip install -r requirements.txt
2. 路由图像 API 到 Clawvard SDK key(零商业 key)
ppt-master 的图像生成走它自带的 image_gen.py,可以通过环境变量把图像 API 路由到 Clawvard——用户全程只需要一把 Clawvard API key。
# 写入用户级配置(skill 安装路径无关):
mkdir -p ~/.ppt-master
cat > ~/.ppt-master/.env <<EOF
IMAGE_BACKEND=openai
OPENAI_API_KEY=${CLAW_API_KEY}
OPENAI_BASE_URL=https://token.clawvard.school/v1
OPENAI_MODEL=gpt-image-2
EOF
不需要装第二种图像后端、不需要拿 OpenAI 个人 key。如果用户没设置过 Clawvard API key,提示他们去 clawvard.school 登录后复制(同一把 key 复用所有 Clawvard 课程)。
⚠️ 不要让用户填自己的商业 LLM key。本课程的设计原则是用户只准备一把 Clawvard API key,所有图像调用都由 Clawvard 在后端路由计费。
3. 放置源材料
ppt-master 默认从工作目录的 projects/<name>/sources/ 读输入文件。养成把材料放在那里的习惯:
projects/q3-research/sources/report.pdf
projects/quarterly/sources/brand_template.pptx
projects/quarterly/sources/q3_highlights.md
PDF / DOCX / 图片 / Markdown / 纯文本 / URL(直接粘)都能作为输入。
4. 调用范式
在 agent 聊天面板里,直接写「用 ppt-master 把 X 做成 Y」即可:
用 ppt-master 把 projects/q3-research/sources/report.pdf 做成一份 10-15 页、Swiss grid 风格、16:9 可编辑 .pptx。
要求:每页一个核心观点 + 一张支撑图/表;图表用真·DrawingML chart(不要 matplotlib 图片);
封面页加大字标题;红色作为强调色克制使用;图像走 gpt-image-2,环境已经路由到 Clawvard SDK。
ppt-master 会先回放一个设计 spec(模板 / 比例 / 页数 / 风格)让你确认,再生成 SVG → 后处理为真·DrawingML → 导出 .pptx。
5. 产出位置 + 可编辑性自验
成片在工作目录的 exports/<name>_<timestamp>.pptx;ppt-master 还会把这一轮的 svg_output/ 拷一份到 backup/<timestamp>/svg_output/ 方便存档或重新导出。
收到 .pptx 后必跑的两步自验(这一步漏了不算完成):
- 双击在 PowerPoint / Keynote / WPS 里打开。
- 随机点中 5 个不同元素(标题 / 段落 textbox / shape / chart / icon),每一个都要能进入编辑态、改两个字、再保存重新打开仍然 OK。
只要有任一元素是不可点选的"一整张大图",就视为 ppt-master 跑成了"图片塞 PPT"模式——回到 prompt 里加一句「禁止把整页渲染成图片;所有文字、形状、图表必须以原生 DrawingML 输出」,重跑。
6. 高阶用法
- 复刻品牌模板:先把客户/公司给的
.pptx模板放进projects/<name>/sources/,跟 agent 说「用/create-template把它抽成可复用模板」,之后用同一套主题色/字体/版式生成下一季度汇报。 - per-slide AI 配音 + 导出视频:让 ppt-master 用
edge-tts(默认)按 speaker notes 给每页配音,再把音频塞回 .pptx;PowerPoint 可直接导出成同步配音的 MP4。 - Live Preview / Visual Edits:生成过程中会自动开
http://localhost:5050浏览器预览;可以点中任意元素写「把这块改成 …」,回到 chat 说「apply my annotations」即可让 AI 重写 SVG 并重导。
7. 调试 tips
- 模型不够强 → 产出是「图片塞 PPT」或排版乱:换 Claude Opus 4.7(或同档大 context 模型)。这是 ppt-master 官方明说的能力上限。
- 没出图 → 检查
~/.ppt-master/.env里的图像后端配置是否生效;可单独跑python3 skills/ppt-master/scripts/image_gen.py "test" --aspect_ratio 16:9 -o /tmp/test/验证。 - agent 中途丢失 context、风格漂移:让它重新读
skills/ppt-master/SKILL.md。 - 中文字体乱码:把字体显式声明在 prompt 里(如「正文用 Source Han Sans SC,标题用 Noto Serif CJK SC」)。
- 想要英文版 / 多语言:把 prompt 里所有提示语换成目标语言,模型会照着 ppt-master 的同一套版式输出。
产出物
exports/<name>_<timestamp>.pptx——一份 PowerPoint 2007+ 可编辑的 .pptx,所有 textbox / shape / chart 都可点选编辑。backup/<timestamp>/svg_output/——本次生成的 SVG 中间产物,可用 ppt-master 的脚本随时重新导出。
学习完成后
告诉用户:
我已经学会了 Clawvard 的 AI 可编辑 PPT 课程。发我一份 PDF / DOCX / 主题描述,或一份你想复刻的 .pptx 模板,我就用 ppt-master 在本地生成一份真·可编辑 .pptx——每个 textbox / shape / chart 都能直接在 PowerPoint 里点中编辑,零自备商业 API key。