V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  WithoutSugarMiao  ›  全部回复第 1 页 / 共 2 页
回复总数  26
1  2  
2 小时 1 分钟前
回复了 NQ 创建的主题 Android 1000 以内的安卓手表有推荐的吗
华米跃我 GTS4 。 已经用了 3 年。充一次电稳定用一周。
29 天前
回复了 RIckV2 创建的主题 生活 遇到这样的孩子怎么办?
33 楼 给你正解了,父母和孩子 一起去看心理医生。
内部斗争呗,做到王腾这个级别,能随随便便去泄能被辞退的密?换句话说 能被辞退的泄密,多半要上升到送局子了。
29 天前
回复了 Ketteiron 创建的主题 咖啡 每周末咖啡短暂戒断怎么有效缓解?
@cherryas 我还真没有出现过,我一般是每年到夏天的时候,会开始喝,但是冬天就很少喝,因为不喜欢喝热的。而且我是第一次听说『咖啡戒断』这个词,工作这么多年,身边很多喜欢喝咖啡的,也没有听他们提到过这词。
@dssxzuxc 比如上个月八月份,有一天出差了,没有喝,有两天 全天都在和用户开会,也没喝。正常的话我是每天都喝的。『大部分人 2 天以上会有很明显的反应,头痛、精神萎靡等等。』这个结论有点意思,我确实遇到过喝咖啡 晚上睡不着的,但是还是第一次听说 常喝咖啡的 停了 会出现明显反应。
30 天前
回复了 fzdoudou 创建的主题 职场话题 下班时间兼职送外卖月入五千挑战
虽然很钦佩兄弟的毅力 以及行动力。但是我觉得你的努力方向是不是错了啊,作为程序员,你工资提升无望,不是应该提高自己的能力吗?现在 AI 这么发达,学习门槛显著下降,你有这种毅力,我觉得用到学习上,完全也可以提升工资吧。每天刷两道算法题,自己弄弄开源项目。跑外卖只是即时来钱快,身体累垮了,更严重啊。
30 天前
回复了 Ketteiron 创建的主题 咖啡 每周末咖啡短暂戒断怎么有效缓解?
还有这种情况吗?我是一周七天 每天都喝,但是偶尔不喝 也没出现什么戒断反应啊。但是我不是为了工作日提神,就是觉得冰美式好喝。
31 天前
回复了 jrlee1204 创建的主题 程序员 大模型学习路径求大佬指导!
https://sunp.eu.org/t/1150043 看看这个帖子呢 哥们
31 天前
回复了 tangmanger 创建的主题 数据库 你们平时手撸 SQL 多吗?还是 ORM 优先
自工作以来,就没手撸过。
31 天前
回复了 young1 创建的主题 程序员 大模型吐 JSON
模型能力问题。
1. 如果现在 Zero-shot ,就换成 Few-shot ,看看效果;
2. 如果只是很少的情况会这样,那就重试一下就可以了。或者直接把 json 部分丢到 小模型里,让他纠错。
3. 实在不行就换模型呗。
千万级其实都没必要特意问一下,常用的两个 pgvector 、milvus 随随便便做到。
我现在的公司就是专门帮其他公司做智能体的。我目前负责的两个项目,一个是面向央企的,总招标千万级别,一个是和化工企业共建的,价值也在百万左右,但是我们做的都是完整的解决方案,如果光是训练模型,可能便宜不少。

但你如果是技术,还是推荐你自己做的。看你的数据是什么类型的,如果是文档型的,和大家说的一样,可以直接用 RAG 。如果非常细的业务场景可以直接微调,几万条的数据已经能有非常好的效果了。

可以参考下这个例子( https://www.aliyun.com/solution/tech-solution-deploy/2925027 )。从一句话中提取结构化信息,用 1000 条左右的数据,就把 0.6B 模型的准确率从 14% 提升到了百分之 98%。

至于什么时候用 RAG ,什么时候微调,其实一般都是结合使用的。比如那个化工项目,甲方提供了 产品对应的化学原料(例如:塑料的原料可能有聚氯乙烯 PVC 、聚乳酸 PLA 、色母粒等),用这些数据训练产品原料预测模型,输入是产品名称,输出就是预测需要的化学原料。然后还有一些文档,比如某些产品的原料使用标准、基础化工原料介绍,这种就放在 RAG 里,执行任务的时候检索。

价格的话,我自己训练模型一般用这个 https://www.autodl.com/ 里面的机器比常用云会便宜点。比如阿里云 80G 显存 一小时 50 多,这个服务 13 块钱一小时。 你训练的时候可以按照小时买,估计几千块钱 就能支持你训练好模型,部署的时候可以转包年包月。
33 天前
回复了 gullitintanni 创建的主题 程序员 骑士决斗(面试题分享)
有这空,不如刷点算法,比这有意思
36 天前
回复了 guiyumin 创建的主题 Cursor cursor 是越来越不行了
首先你用 sonnet 4 ,不开 max mode ,这个是没问题的。你两周用了 1000 刀,绝对是姿势不对。我公司给提供的是团队账号一月 40 刀,我基本是用不完了。每天都监控一下每次任务的 token 消耗。

争取一个对话只完成一个任务,这点很关键,我通常一个对话里,最多三次交互。

每次给他发布的任务都只修改某一个具体的功能。规则配置里配制好,让他每次都最小修改。
41 天前
回复了 Ranglage 创建的主题 职场话题 如何能找到靠谱的程序员呢
为什么定这种技术栈呢? java / python + vue 不行?
妹子好看吗?
43 天前
回复了 wangshuo6 创建的主题 程序员 claude code 的核心逻辑
@wangshuo6 你在这里发的这篇文章,我已经看到好多公众号的洗稿了,没想到在 V2 又看见了。这篇文章里用的方式是通过捕捉网络请求来判断 cc 的执行逻辑,这其实并没有什么问题,但是这并不是 cc 的效果很好的原因,而是所有的 agent 都可以使用这套通用的逻辑。那么差别在哪,你的分析 和 你的项目完全没有体现出来。

想探究 cc 的执行流程不如看看这个: https://github.com/shareAI-lab/analysis_claude_code
@ThirdPer 不敢当不敢当 只是个小外包,在首都。
3. 最后一步就是,去了解最最最最新的技术。去阅读最新的论文!一定要是最新的,不是一年两年前的,而是一个月两个月之内的。举个例子,我昨天在看这个( https://arxiv.org/html/2507.13334v2 )。

你把我说的都学会了入行我觉得没问题。然后还有其他问题,你再问吧。
先说说我自己的情况吧。我是传统 python 开发入行的,18 年毕业,在 2024 年初,RAG 的概念刚火起来,当时是在一个大传统外企的基础架构组,我是跟老板主动请缨做了个内部 RAG 系统,一直做到了 2024 年末,我被裁员了,但是 RAG 项目最后的效果还不错,也在公司用起来了。后来 gap 了半年,从今年五月份开始找工作,找的所有的工作几乎都是 AI 应用方向的。最后的结果是 7 月份初以外包的形式入职了现在这家专门做 AI 应用的公司,外包的工资是税前 30+,可能在 V2 里还不太行,不过我学历不行,所以这个工资对我个人来说过渡也还好。

# 岗位机会多不多?
多!接到好多面试,甚至不需要自己投简历,就有源源不断的 hr 跟你要简历,但是这些里都以外包为主,好岗位还是要你自己投。

# 福利待遇?
跟岗位没关系,只跟公司有关系。我在外包,所以也没有福利待遇一说了,能正常发工资就好了。

# 技术门槛?
现在入职 1 个月左右,我的体验是与之前做 crud 完全不同,主要工作基本就集中在模型调整以及处理各种模型的输入输出上,还陪商务和销售出了一次差,见了一下甲方。

# 和传统开发重合?
我的感觉是重合度非常小。我这家公司基本是 all in AI ,传统开发百分之 90 以上的工作都是 AI 来完成了,公司可以申请 cursor 的额度,传统开发我直接全程 claude4 。

# 工作中是否有隐藏的难点?
是工作都会有,跟 AI 关系不大。

# 对大模型原理的理解?
不太明白你这里的理解指的是什么程度。如果是指预训练的话,那应该是由专门的算法工程师来做,一般都是 985211 里的高手或者清北起步(顺带一提,我目前这个公司就很多清北的硕博)。你问的 AI 应用一般就是指后训练,相关的技术栈是必须要掌握的。包括 损失函数、梯度下降等机器学习的基础概念,或者微调算法 lora 、freeze ,微调框架 swift 等,或者大模型的部署框架 vllm ,或者大模型构建框 langchain 家族以及类似他框架等等等。

# 还有你没提到的是 Agent 的构建。因为 AI 应用开发以 Agent 为主。
RAG 系统,或者多 Agent ,我的建议是多去看看 github 的开源框架,比如高 star 的 qanything 、Langchain-Chatchat
等等。

# 想入行的话,推荐你三步走。
1. 首先你看那些卖课的肯定是不够用的,而且也不用买课,我推荐你一个免费的阿里云的课( https://github.com/AlibabaCloudDocs/aliyun_acp_learning.git )你可以跟着试试,全做完的话,你基本能了解个大概了。
2. 然后就是自己去做个项目,尽量把学到的都用上。具体了解一下,
- 怎么处理各种数据,包括 pdf 、excel 、word 等等;
- 怎么提升召回率(把这篇文章看完! https://freedium.cfd/https://levelup.gitconnected.com/testing-18-rag-techniques-to-find-the-best-094d166af27f )。
- 实战中微调都怎么调整,什么时候调整 lr 、什么时候调整训练轮数、什么时候调整 lora_rate 等等各种问题,都需要实际微调几次才能有所了解。
- 怎么构建多 Agent ?都需要那些角色?
- 怎么构建 prompt ?都需要注意那些要素?
70 天前
回复了 ainyyy 创建的主题 程序员 问老开发一个前后端矛盾的问题
工作七年,两年全栈,五年后端。我和评论区意见可能不太一样。这并不是什么扯皮的问题,也不是规范不规范的问题(当然领导要求另当别论),而是前后端职责分配的问题。前后端分离最主要的目标,不就是能让前端专注于页面交互,而后端进行数据处理吗?你又让他自己去做转换数据,那不是又把前后端分离的界限模糊了吗?

都工作八年了,我觉得不太应该问出来这种问题。虽然我自己工作的时候,也遇到过高手前端,让我直接给数据就行,他来处理格式什么的。但是这不代表这是前端的主要职责,前端帮你做的是人家做的好,而不是人家应该做的。
1  2  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   3356 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 04:37 · PVG 12:37 · LAX 21:37 · JFK 00:37
♥ Do have faith in what you're doing.