V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
jsxyzb
V2EX  ›  程序员

AI 生成 PPT 方案请教

  •  1
     
  •   jsxyzb · Jan 30 · 3014 views
    This topic created in 96 days ago, the information mentioned may be changed or developed.

    最近公司安排做 AI Slides ,我看了下 GitHub 上 ai-slides 这个 topic ,目前活跃的项目基本就两个:

    • banana-slidesGitHub):用 Nano Banana 模型生成 PPT 页面图片,视觉效果不错,但导出的.pptx本质是图片嵌入,无法编辑文字或调整布局;
    • Xpptxxpptx.com):能直接生成结构化的可编辑 PPT 。

    我现在的问题是:有没有办法把 banana-slides 生成的那种高质量页面图,自动转换成真正的可编辑 PPT ?比如识别出标题、正文、图表区域,还原成原生文本和形状?

    求教有没有现成工具或技术方案。

    20 replies    2026-02-07 13:03:47 +08:00
    Natumsol
        1
    Natumsol  
       Jan 30 via Android
    试试 lovart ,满足你的诉求
    hanssx
        2
    hanssx  
       Jan 30
    banana 生成 html ,html->ppt
    leeg810312
        3
    leeg810312  
       Jan 30
    第二个不是 github 的吧?我看不少工具都是生成 html 当作 ppt 用,可能更通用,用浏览器打开看
    laowu2012
        4
    laowu2012  
       Jan 30
    banana-slides 不是有选文字分层解析吗
    loopinfor
        5
    loopinfor  
       Jan 30
    第一个感觉很惊艳,不是说视觉效果很酷炫,而是完全没 AI 味。
    市面上很多 AI PPT 做出来的排版都是文字很小、图标巨大,跟普通中文 PPT 模板差异很大。
    yrom
        6
    yrom  
       Jan 30
    apacheinsky
        7
    apacheinsky  
       Jan 30   ❤️ 2
    让 AI 生成 latex ( beamer ),可编辑度绝赞爆表!
    CandyMuj
        8
    CandyMuj  
       Jan 30 via Android
    可以试试 skills
    love060701
        9
    love060701  
       Jan 30
    https://codia.ai/noteslide/

    OCR+inpaint ,把图片变成可编辑的 PPT 文件。但是用过你就知道了,还是 AI 生成更方便,现在 Banana 改图会出现字错乱的情况,最多半年就能解决,到时候就是完全 AI 生成和编辑 PPT ,始终是图片格式。
    TonyG
        10
    TonyG  
       Jan 31
    全自动方案一般效果都不行,vibe coding 16:9 的 html ,引入各种 chart, tailwind css, fontawsome, npm 引入 cheerio ,pptxgenjs ,puppeteer 生成 html 生成截图、生成 ppt 页面的 node 命令,html 用提示词微调不足,图片用各种大模型免费生图形成插入图、背景图,结合 qwen image edit 微调图片内容。然后你就可以得到很漂亮的 ppt 了。
    yayoec
        11
    yayoec  
       Jan 31
    banana-slides 有导出可编辑的功能,虽然做不到完美,但是确实能用
    youyouzi
        12
    youyouzi  
       Jan 31
    有个技术问题咨询一下各位大佬:
    gemini 生成的是图片,他如何做到可以把图片转为 ppt 以后,下载以后可以编辑呢?纯图片》可编辑 ;这个过程是提示词让 gemini 做了什么吗?
    hackpro
        13
    hackpro  
       Jan 31
    蹲一个 NotebookLM 转可编辑 ppt 方案
    syferie
        14
    syferie  
    PRO
       Feb 1
    我前段时间设计了一个方案,先利用 NanoBananaPro 来生成 PPT 图片,效果与 banana-slides 类似。
    之后实现可编辑,核心思路是利用了 Gemini 的视觉思维能力去识别图片中的文字位置和内容样式,从而生成遮罩。
    然后利用纯色填充+渐变填充来实现移除文字。
    移除之后将上面识别到的文字与样式放置到对应位置,组装为一个完整 PPT ,从而达到可编辑文字的 PPT 效果。

    https://github.com/MoonWeSif/NextCreator
    syferie
        15
    syferie  
    PRO
       Feb 1
    @youyouzi 可以参考我这里的开源思路,核心利用了 Gemini 的视觉思维能力去识别图片中的文字位置和内容样式,生成遮罩。
    然后利用纯色填充+渐变填充来实现移除文字。
    移除之后将上面识别到的文字与样式放置到对应位置,组装为一个完整 PPT ,从而达到可编辑文字的 PPT 效果。

    核心还是考虑到作为一个桌面端应用,尽量轻量化,原先是 OCR+Inpaint 的思路,但是依赖外部需要部署的服务,过于繁琐了,现在的话下载即用。
    zerovoid
        16
    zerovoid  
       Feb 1
    题外话,我在想什么不直接用网页替代 PPT 来做演示呢,PPT 能做的事,网页都能做(上下页切换,各种动画效果,浏览器也能全屏),以前用 PPT ,只是很多办公人员不会写代码罢了,现在都交给 AI 写,我看 PPT 可以直接淘汰了。
    coobin
        17
    coobin  
       Feb 2
    banana 可以生成 google 的 slides ,slides 可以导出为 pptx
    youyouzi
        18
    youyouzi  
       Feb 2
    @syferie #15 所以是通过提示词让他生成的时候分离背景图片和文字吗?
    Jannok
        19
    Jannok  
       Feb 2
    我觉得 kimi 的其实还可以,notebooklm 那种很炫酷但是不能编辑,kimi 的是传统 ppt 那种有排版布局的,实用性挺高的,用来做年终总结汇报啥的还蛮好的。
    syferie
        20
    syferie  
    PRO
       Feb 7
    @youyouzi 不是,都是自己处理的。上面说的原理应该挺清晰的。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1124 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 118ms · UTC 17:58 · PVG 01:58 · LAX 10:58 · JFK 13:58
    ♥ Do have faith in what you're doing.