V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  yafeilee  ›  全部回复第 1 页 / 共 13 页
回复总数  249
1  2  3  4  5  6  7  8  9  10 ... 13  
@ben2ex 这个安装的子系统是中期引入了一个 bug 导致,后面已经修复了哈。能力上对齐 CC ,但同时具备通用 Agent 的能力(比如微信、飞书一键直连、定时任务、Skill 生态等),适合国产更多场景。
@chenxiankong 嗯我们做了不少测试验证的结论:Agent 上半场是智能,下半场是账单。最近会放出更多工具对比的测评项。
@ximaoyang 没几个 Agent 敢说完全超越 CC 呀,但在易用性,国产化 OpenClacky 有绝对优势。还有不用担心封号。
这是常见误区,我们花了大教训的:

第一代( 2024-2025 上半):RAG / 知识库
把用户 codebase 、文档、历史会话全 embedding 进向量库,hybrid 检索 + 重排 + query rewrite 。Agent 流程是"先查上下文,再答"。

实际跑下来的问题:

成本高,每次更新的 codebase ,需要同步更新向量,实时性无法保证。
准确率有限,例如听起来 90% 的召回率是不是还不错,但是对不起,不仅没有用,还可能有害,我预测,97%的召回率可能才刚刚够用。
多了一个会失败的部件(向量库),增加了很多延迟。
结论:千万不要搞任何 RAG 、知识库分片。如果你要上 Agent ,请直接上 Agent ,外加一个适合 AI 去阅读的网站就可以了。(参考我们自反思 Skill product-help 的实现)


完整 harness 设计经验分享: https://sunp.eu.org/t/1212780
@king888 嗯嗯 看起来安装流程对已经有某些已经安装过的组件的兼容处理不好。你加我一下微信 lyfi2003 注明 V2EX ,我们帮排查下。
Docker 安装,Debian 的一键安装也已经支持,有兴趣的朋友可以试试~
@king888 感谢反馈,我们看下问题。如果方便可以移步到 https://github.com/clacky-ai/openclacky 提个 issues ,把日志复制更完整点
@janyork 好主意 我们最近会继续增加更多能力测试。
@gongjs 好,稍等我会把原始数据放在 github 上。
@JasonYip 嗯,你的担心是有道理的,我们在实际使用的感受是跟 ClaudeCode 能力基本一致。不过为了更严谨,我们会接下来继续补充一些能力上的 benmark 。arxiv 的建议也很好,我们也研究下。
@f11st1 谢谢提醒
@gotoschool 可以的 后面官网上会放出用户联系方式 先关注哈
@287854442 对,切模型后一定会失效一次。
@gongjs 文中有提,需要预防失败回滚一次。
@caiweilong00 很多 LLM 需要显式声明。还有容错需要(处理图片、文件、插入新消息等),甚至 Thinking 。所以提升缓存命中要考虑的因素很多。
@longxinglink 你觉得哪些长任务特性是特别关键的 我学习下~
@garyalen 😄
@jerrrrr 加密 skill 是另一个话题,后面会逐步展开。
第二个问题:省 token 跟任务完成是两个维度,并不矛盾。目前我们对具体任务展开评测,包括我们实际使用来说,模型一致的情况下,codex, cc 的表现我们完全是同量级的。甚至有些还更优秀。这个本质是是 harness 中最重要的部分:context 管理。这个后面我们再补充更多测试场景出来。我敢说的话,harness 工程是否优秀直接决定了最终任务情况,包括是否省钱,完成速度。
第三个问题,非模型厂就是做极致的开源好用,用 BYOK ,用社区力量,让用户拿到性价比最好的产品,不被模型锁定。商业化思考我们在价格页也有列出,大家也不用担心,这个事情可以做很长很长时间。
@Java4ever 支持~ 自定义里面选 openai 兼容接口就可以了。遇到哪些配不上的中转可以提个 issue 我们排查下。已知有些中转站支兼容了 anthropic 格式的话可能会有问题。
@FakerLeung 里面渲染了几个 html 产物,可能旧的版本会有点卡。之前已经优化过一轮。升升版看下~
@skuuhui 辛苦啦,我可能记得不是超级清楚,可能在其他渠道表达的,我微信就有不下 5 位直接私问,还有要上门学习的。

原话一:
[握手]亚飞总你好,我们最近也在做 AI native 和 Harness 工程。想沉淀下一些 AI 友好的内容、物料、文档、测试用例、可执行计划。
看到亚飞总你写的文章这么硬核全是干货,有时间我们交流交流。

原话二:
看了亚飞哥现在的产品 OpenClacky ,真的太硬核了。奇绩创坛。[强]
约个时间我线下拜访一下亚飞总可以吗,我们互相交流一下技术方案。 

这篇文章是回应大家的需求。

ps: 我也想跟 V 站的伙伴说,咱们中国开源也有技术硬核的东西,希望大家多多支持,平替 ClaudeCode (它实在太“贱”了,甚至面向一般用户更友好的 Agent 。
@v2yllhwa 主要是模型并不知道有新的更新,在处理新任务时它可能会忘记使用技能。session context 起到一个通知的作用,但也要谨慎使用它。另外,这种想法虽然不难想到,但实践时可能会导致 LLM 层要重构消息体,所以也有不少工程难度。有兴趣可以研读下代码。
@yesha 帮点点赞:) 欢迎 issue 和 PR~
1  2  3  4  5  6  7  8  9  10 ... 13  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1063 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 17ms · UTC 23:15 · PVG 07:15 · LAX 16:15 · JFK 19:15
♥ Do have faith in what you're doing.