V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
jsxyzb
V2EX  ›  程序员

AI 生成 PPT 方案请教

  •  1
     
  •   jsxyzb · 1 月 30 日 · 1721 次点击

    最近公司安排做 AI Slides ,我看了下 GitHub 上 ai-slides 这个 topic ,目前活跃的项目基本就两个:

    • banana-slidesGitHub):用 Nano Banana 模型生成 PPT 页面图片,视觉效果不错,但导出的.pptx本质是图片嵌入,无法编辑文字或调整布局;
    • Xpptxxpptx.com):能直接生成结构化的可编辑 PPT 。

    我现在的问题是:有没有办法把 banana-slides 生成的那种高质量页面图,自动转换成真正的可编辑 PPT ?比如识别出标题、正文、图表区域,还原成原生文本和形状?

    求教有没有现成工具或技术方案。

    19 条回复    2026-02-02 13:19:14 +08:00
    Natumsol
        1
    Natumsol  
       1 月 30 日 via Android
    试试 lovart ,满足你的诉求
    hanssx
        2
    hanssx  
       1 月 30 日
    banana 生成 html ,html->ppt
    leeg810312
        3
    leeg810312  
       1 月 30 日
    第二个不是 github 的吧?我看不少工具都是生成 html 当作 ppt 用,可能更通用,用浏览器打开看
    laowu2012
        4
    laowu2012  
       1 月 30 日
    banana-slides 不是有选文字分层解析吗
    loopinfor
        5
    loopinfor  
       1 月 30 日
    第一个感觉很惊艳,不是说视觉效果很酷炫,而是完全没 AI 味。
    市面上很多 AI PPT 做出来的排版都是文字很小、图标巨大,跟普通中文 PPT 模板差异很大。
    yrom
        6
    yrom  
       1 月 30 日
    apacheinsky
        7
    apacheinsky  
       1 月 30 日   ❤️ 2
    让 AI 生成 latex ( beamer ),可编辑度绝赞爆表!
    CandyMuj
        8
    CandyMuj  
       1 月 30 日 via Android
    可以试试 skills
    love060701
        9
    love060701  
       1 月 30 日
    https://codia.ai/noteslide/

    OCR+inpaint ,把图片变成可编辑的 PPT 文件。但是用过你就知道了,还是 AI 生成更方便,现在 Banana 改图会出现字错乱的情况,最多半年就能解决,到时候就是完全 AI 生成和编辑 PPT ,始终是图片格式。
    TonyG
        10
    TonyG  
       1 月 31 日
    全自动方案一般效果都不行,vibe coding 16:9 的 html ,引入各种 chart, tailwind css, fontawsome, npm 引入 cheerio ,pptxgenjs ,puppeteer 生成 html 生成截图、生成 ppt 页面的 node 命令,html 用提示词微调不足,图片用各种大模型免费生图形成插入图、背景图,结合 qwen image edit 微调图片内容。然后你就可以得到很漂亮的 ppt 了。
    yayoec
        11
    yayoec  
       1 月 31 日
    banana-slides 有导出可编辑的功能,虽然做不到完美,但是确实能用
    youyouzi
        12
    youyouzi  
       1 月 31 日
    有个技术问题咨询一下各位大佬:
    gemini 生成的是图片,他如何做到可以把图片转为 ppt 以后,下载以后可以编辑呢?纯图片》可编辑 ;这个过程是提示词让 gemini 做了什么吗?
    hackpro
        13
    hackpro  
       1 月 31 日
    蹲一个 NotebookLM 转可编辑 ppt 方案
    syferie
        14
    syferie  
    PRO
       3 天前
    我前段时间设计了一个方案,先利用 NanoBananaPro 来生成 PPT 图片,效果与 banana-slides 类似。
    之后实现可编辑,核心思路是利用了 Gemini 的视觉思维能力去识别图片中的文字位置和内容样式,从而生成遮罩。
    然后利用纯色填充+渐变填充来实现移除文字。
    移除之后将上面识别到的文字与样式放置到对应位置,组装为一个完整 PPT ,从而达到可编辑文字的 PPT 效果。

    https://github.com/MoonWeSif/NextCreator
    syferie
        15
    syferie  
    PRO
       3 天前
    @youyouzi 可以参考我这里的开源思路,核心利用了 Gemini 的视觉思维能力去识别图片中的文字位置和内容样式,生成遮罩。
    然后利用纯色填充+渐变填充来实现移除文字。
    移除之后将上面识别到的文字与样式放置到对应位置,组装为一个完整 PPT ,从而达到可编辑文字的 PPT 效果。

    核心还是考虑到作为一个桌面端应用,尽量轻量化,原先是 OCR+Inpaint 的思路,但是依赖外部需要部署的服务,过于繁琐了,现在的话下载即用。
    zerovoid
        16
    zerovoid  
       2 天前
    题外话,我在想什么不直接用网页替代 PPT 来做演示呢,PPT 能做的事,网页都能做(上下页切换,各种动画效果,浏览器也能全屏),以前用 PPT ,只是很多办公人员不会写代码罢了,现在都交给 AI 写,我看 PPT 可以直接淘汰了。
    coobin
        17
    coobin  
       2 天前
    banana 可以生成 google 的 slides ,slides 可以导出为 pptx
    youyouzi
        18
    youyouzi  
       2 天前
    @syferie #15 所以是通过提示词让他生成的时候分离背景图片和文字吗?
    Jannok
        19
    Jannok  
       1 天前
    我觉得 kimi 的其实还可以,notebooklm 那种很炫酷但是不能编辑,kimi 的是传统 ppt 那种有排版布局的,实用性挺高的,用来做年终总结汇报啥的还蛮好的。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2771 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 04:31 · PVG 12:31 · LAX 20:31 · JFK 23:31
    ♥ Do have faith in what you're doing.