V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
d0r1an
V2EX  ›  程序员

转发一篇好文 —— 《What We Talk About When We Talk About Agent Infra》

  •  
  •   d0r1an · 1 月 30 日 · 1962 次点击
    17 条回复    2026-02-06 21:53:54 +08:00
    maolon
        1
    maolon  
       1 月 30 日
    有意思, 所以他的意思就是把 agent 的 workfow 应拆净拆到一个 atomic 语义的步骤然后把各个步骤固定化和容器化以应对 scale 和不确定性问题?
    d0r1an
        2
    d0r1an  
    OP
       1 月 30 日
    @maolon 是的,超强的抽象能力
    d0r1an
        3
    d0r1an  
    OP
       1 月 30 日
    我按照这个抽象实现了一个 SkillBox

    https://github.com/boxlite-ai/boxlite/pull/170
    Reminders
        4
    Reminders  
       1 月 30 日   ❤️ 2
    agent 执行环境的不隔离,执行过程产生的副作用的确是现实问题。

    如果把 skills 和执行环境打包,做到无外部依赖、无副作用、可重用、规模化。也许是个不错的方向。
    d0r1an
        5
    d0r1an  
    OP
       1 月 30 日 via iPhone
    Reminders
        6
    Reminders  
       1 月 30 日
    @d0r1an #3 我没太明白这个怎么使用,是在 python 中调用这个 SkillBox 么,这个 SkillBox 是不是也应该像 docker 一样提供一个打包好的 image 呢?
    d0r1an
        7
    d0r1an  
    OP
       1 月 30 日 via iPhone
    @Reminders 这个 skill 是跑在微型虚拟机里面的,独立内核。目的是让 agent 或者 app 调用,例如文章提到的 buy coffee skill
    Reminders
        8
    Reminders  
       1 月 31 日
    @d0r1an #7 意思是,如果把项目部署在服务器上,我想为每一个用户分配一个 skill_box ,那么每个用户都可以通过

    boxlite.SkillBox() as skill_box

    创建一个 skill_box 使用是吗?无法服务重启,用户可以无负担在再次创建出一个 skill_box 重新使用嘛?
    Cbdy
        9
    Cbdy  
       1 月 31 日
    有趣的思路
    d0r1an
        10
    d0r1an  
    OP
       1 月 31 日 via iPhone
    @Reminders 是的
    liuchao719
        11
    liuchao719  
       24 天前   ❤️ 1
    和我之前的一个想法特别类似,agent 现在要处理的逻辑层次太多了,每一层都会带来不确定性。或许还有一种思路是,每次遇到不确定性就分配一个 subagent 处理不确定性。因为与其手动封装各种可重入节点,不如让 llm 自己去划分任务的逻辑层次。
    d0r1an
        12
    d0r1an  
    OP
       24 天前
    @liuchao719 可以一起讨论下,精进整个思路和实现
    liuchao719
        13
    liuchao719  
       20 天前 via iPhone
    @d0r1an 之前不是有人指挥好几个 Agent 干活,人只需要像自己有点像 leader 一样规划就行。其实这个思路是把 agent 作为 leader ,让他去安排一些子 Agent 去做细分的活儿。这样子,Agent 就能够自己去处理一些不确定性的东西,减少了上层 Agent 的一些认知负担。可以嵌套两三层这种架构,专门拆解复杂问题。但我这个想法应该是去年的,现在应该已经有类似的 Agent 架构出来了,只是我还没时间去研究。

    然后最近不是 skill 很火嘛,然后还有那种自学习的 skill ,其实对于一个层级上的子 Agent 来说,如果每次划工分给他的问题是合理的,那么我觉得他很快就能自学习出一整套 skill 来,其实很像公司的架构了。
    d0r1an
        14
    d0r1an  
    OP
       20 天前
    @liuchao719 Interesting insight 。我琢磨下
    liuchao719
        15
    liuchao719  
       19 天前
    @d0r1an 我有了一些新想法:
    理想状况下 Agent 是一定要完成任务的,但是考虑到现实情况,有可能我们也不能清楚 Agent 能不能完成任务,只是先把任务交给它试试(比如大部分不懂技术的人用 clawdbot 的时候)。这时我们不是想让 Agent 一条路走到黑,然后告诉我他干不了,而是希望 Agent 在执行的过程中,如果过于困难,就向上请求支援。

    这个机制还可以应用在多层 Agent 架构中。面对复杂问题,首先分散出一堆子 Agent 探索,子 Agent 如果过于困难,则向上汇报,主 Agent 再根据子 agent 执行结果,综合评定最小解决代价后继续灵活改变计划,或寻找其他解决方案。
    liuchao719
        16
    liuchao719  
       19 天前
    目前无论是我自己用 AI ,还是观察别人用 AI ,都有一个核心问题:当前 AI 无法感知到所有执行环境。比如一个 API 不通,究竟是网断了?还是梯子挂了?还是服务有问题?可能我们刚好忘记告诉它了某个事实,导致它在执行的过程中一遍遍尝试,浪费很多 token 和时间。但如果 AI 能够“浅尝辄止”并向上反馈,再结合自总结 skill 的机制,把人类的反馈记下来,我觉得 AI 未来应该会是很好的助手/帮手,而非仅仅是一个高效率的执行者。
    d0r1an
        17
    d0r1an  
    OP
       19 天前
    @liuchao719 👍 这就是真正的 AI 同事,AI 实习生,遇到不懂的事情要知道向 mentor 求助
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5855 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 02:14 · PVG 10:14 · LAX 18:14 · JFK 21:14
    ♥ Do have faith in what you're doing.