V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  MuyuQ  ›  全部回复第 3 页 / 共 16 页
回复总数  302
1  2  3  4  5  6  7  8  9  10 ... 16  
我去, 这帖子对喷了一天了,管理还没干活儿。
@ganbuliao 有 PC 版吗? 第二个链接失效了。第一个是 mac 版。感谢
你们如果有外版 esim 的话,就不用去买实体卡了。直接在线网申就行。
你的点子绝了。
就在你家试行吧,一年后报告给大家看看效果。
@qW7bo2FbzbC0 https://base64.us/ 用这个转一下
5 月 9 日
回复了 lemonshuo 创建的主题 职场话题 这个年龄,有点迷茫
上海一万多。早点跑路吧。不要浪费时间。
也别想去北京,把去北京从你的计划里划掉。浪费时间。除非女方是北京土著房东能发你一套。
@h4nru1 反思的前提是他自己知道错了,而且知道错在哪儿。
很多任务并不是显式报错。可能在 Agent 看来没问题,反而会强化错误经验。
很多任务可能末端报错,实际错误点在中端,但 AI 只凭感觉修改了末端症状。(这个在 AI 编程中太常见了,agent 也难免)
没有可靠反馈和人工审查,反思很容易变成 agent 自我确认或者末端打补丁。
以目前大模型的能力,人工介入在所难免,人工智障 agent 需要人工导师时不时盯着。
@h4nru1 不止是索引冲突。
是更大范围,更深层的冲突。
memory 可能是错的、过期的、过度泛化的。
skill 也可能只是某次局部成功经验。
workflow 是谁定义的,什么时候该稳定,什么时候该更新?
所以这不是 skill 和 memory 同步一下就能解决的问题。
真正难的是:skill 、memory 、workflow 都会变化,而且还会互相影响。
适用范围怎么定?过时怎么判断?权重怎么分配?冲突时谁正确?这些都不是靠模型临场判断能稳定解决的。
所以还是得靠人工判断,而不是自主迭代。
Agent 倒是可以定时做一次自检,把可能冲突的地方展示给用户,让用户判断。(但自检开销巨大)
我也就瞎想了一下。 吃饭去,吃饭去。
@h4nru1 不止是 skill 的冲突。skill 和 skill 的冲突是最好解决的。 问题是 skill 和 memory 的冲突,和 workflow 的冲突,memory 和 workflow 的冲突,时间长了哪儿哪儿都可能冲突。 整了一堆名词一堆工程化手段,说白了还是打补丁。现在折腾这么多,还是没办法搞定 agent 的长期行为约束,真让它全自动学习,崩坏是迟早的事儿。
agent 的自进化都会遇到一个问题,新 skill 改变了决策优先级,导致旧流程被改动。
以前可以搞定的任务,因为新 skill 的加入,突然就不会了。要排查就要去面对庞大的历史对话记录。
用的越久,越容易遇到。

自动的分层记忆也有这个问题。如果 agent 自己总结出现了细微的错误(毕竟不是完整上下文),把某段记忆插入了不合适的场景,会导致旧流程被改动。

太多的项目,都喜欢把优点夸大,感觉 agent 是一个完美的自学者。
以下是把帖子喂给 ChatGPT,AI 的看法。
--------
是谁的问题?
技术上:不能简单说谁对谁错。
GA 可能确实有一些值得看的设计,比如 OP 提到的低 token 、浏览器操作、task-centric memory 、自进化等;也有用户反馈浏览器操作不错。 但反方质疑也合理:安装体验、文档、真实生产稳定性、上下文丢失、是否真的比订阅制 Claude/Codex 便宜,这些都不是 benchmark 一张图能解决的。

沟通上:OP 问题更大。
他不是不能安利项目,而是安利方式太“进攻型”:上来拉踩竞品,用博士身份背书,用“吊打”“跪久了”“数据让你不舒服是数据的问题”等话术回应质疑。这会让本来可能讨论技术的人,转而讨论他的态度。尤其在别人说“不喜欢靠贬低别人抬高自己”时,他没有降温,而是继续反击,这基本把帖子带偏了。

评论区也有问题。
后面不少回复已经从质疑项目变成人身攻击,比如直接骂人、攻击学历、攻击表达能力。这些并不比 OP 的攻击性更理性。 但从时间线看,火药味最早是由 OP 的“强营销 + 拉踩 + 高姿态反击”点燃的,评论区随后放大了冲突。

一句话总结
这场争吵的根源是:OP 可能真的喜欢 GA ,也可能不是商业推广,但他用了非常像软广的表达方式,还用拉踩和身份背书包装技术观点;网友一开始质疑推广和语气,OP 没有化解,反而用更强的优越感反击,最后技术讨论变成了互喷。

所以我会判:起因主要在 OP 的表达和姿态;评论区后期的人身攻击也有问题;项目本身是否好用,需要另开一条线单独评估。
从路人的角度来看。
文章很软,有点像广告文。
同类产品很多,GitHub 上一大堆,所以先以怀疑的态度继续看下去。
看完文章,感觉一般,并没有太大的亮点。
文章里 OP 的言谈像大学生,但语气又很不客气,太强势了。
评论区里 OP 给人的感觉是一个大学生拿着 AI 写了一个项目,然后在 V 站宣传,宣传过程中还怼天怼地的态度。
只是个人感觉。
@ChrisV5 是的。但开源的几个项目用起来都各有各的难受。目前最强还是 type less ,但是那玩意儿付费太贵了点。
@capric 几个开源项目我也看过,维护是个问题,修 bug 不积极。而且差距还是挺明显的。
@hxzhouh1 闪电说模型肯定没法和大厂比,自定义功能还是挺好用的。闪电说的优势是搭配豆包流式语音识别,但是等豆包也推出语音输入法的时候闪电说就没什么优势了。 闪电说的付费是 AI 助手,但这个方向肯定打不过千问和豆包。
有一篇爱范儿的广告可以大概了解下。
https://www.ifanr.com/1664830
5 月 8 日
回复了 Cabana 创建的主题 信息安全 Linux 内核又双叒叕现严重本地提权漏洞
@xiaomushen 对半开。 AI 时代会发现更多漏洞,但也更方便开发者修复漏洞。
5 月 8 日
回复了 kim886 创建的主题 云计算 最便宜的云服务器方案是什么?
各家不都有续费同价的产品么。 很便宜
5 月 7 日
回复了 desususula 创建的主题 生活 好像很多人对 AI 一点都不在意?
@ryd994 强大的信息检索和整合能力也是没用吗?在提示词里要求正反对比和事实核查和罗列依据都想不到。 你的文字里主观臆断太强烈了。没办法沟通。
5 月 7 日
回复了 ota 创建的主题 Notion 用了 obsidian 一段時候后又回到了 notion
把 obs 的 skill 投喂给 hermes 。每次写东西的时候写一个大纲,然后直接对给 ai 让它润色。润色的过程中顺便就把格式什么的调整好了,不需要多费心。
1  2  3  4  5  6  7  8  9  10 ... 16  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   958 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 31ms · UTC 21:47 · PVG 05:47 · LAX 14:47 · JFK 17:47
♥ Do have faith in what you're doing.