V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  codingmiao  ›  全部回复第 1 页 / 共 3 页
回复总数  59
1  2  3  
19 小时 34 分钟前
回复了 Flagship9945 创建的主题 Local LLM 需要购买国产显卡本地部署大模型,哪家的比较好
用过海光、昇腾、平头哥。昇腾自建生态加上文档稀烂,体验就是一坨。另外两家 cuda 上能跑的代码随便改改就能跑起来,但比起 n 卡来性能和体验还是要差不少。
@huanxianghao 计算机相关的东西还是挺容易规避 AI 扯淡的,我前段时间补 transformer 的知识,直接先把 github 上 transformer 代码拉下来,让 claude code 给我出个学习教程,每一章节找对应的代码把我当傻子给我讲,边跑 demo 边问,它不厌其烦地回答我,有代码卡着也不会跑偏,感觉很好。
知识库本身只是提供个工具,开源的随便弄弄,大头做好业务梳理,做好合理的分门别类,不然还是一坨放在那没什么大用
这玩意真能作为加解密方法吗?即使明天你把答案发出来,也没有一个快速验证的方法验证你发的答案对不对。反之如果你有快速验证的方法并公布出来,那这个加解密方法也会像 MD5 彩虹表那样迅速被破解掉
这玩意越高水越深,所以我们简单的需求 langchain4j(因为我们有好多 java 的基建),复杂的直接套壳 claude code 😄
4 月 21 日
回复了 izv 创建的主题 推广 简单稳定的 codex 中转, 0.1 倍率,送 10+10 刀额度
这个中转似乎非流式请求有点问题,下面这个请求,"stream"为 false 时就没有输出"content",为 true 时是正常的

curl "https://www.hi-code.cc/v1/chat/completions" \
-H "Content-Type: application/json" \
-H "Authorization: Bearer sk-xxx" \
-d '{
"model":"gpt-5.4",
"stream": false,
"messages":[
{"role":"user","content":"你好"}
]
}'


{"id":"resp_0f935c87f6d1df2d0169e7013c67c08196abb8a696e0191e21","object":"chat.completion","created":1776746813,"model":"gpt-5.3","choices":[{"index":0,"message":{"role":"assistant"},"finish_reason":"stop"}],"usage":{"prompt_tokens":18,"completion_tokens":41,"total_tokens":59}}
4 月 20 日
回复了 seraphlz 创建的主题 OpenAI deep research 生成的研究报告效果如何?
生成出来乍一看效果挺唬人,仔细看很多经不起推敲,我现在是让 claude code 自己去 arxiv 和 github 上搜了总结了,比直接 deep research 可控一点
@spribree 已补充微调脚本至[sft/run_sft.sh]( https://github.com/codingmiao/qwen35-short-cot/blob/main/sft/run_sft.sh)

用了 ms-swift 这个框架来做 lora 微调的,没写代码😄,配下参数一行命令就跑起来了😄。
3 月 24 日
回复了 cat9life 创建的主题 Local LLM qwen3.5 过度思考的问题
这个似乎是 qwen3.5 系列太喜欢过度思考了,我这几天搞了点 deepseek-r1 的数据去微调它,让它学习 ds 的思考套路,效果好了不少 https://github.com/codingmiao/qwen35-short-cot
3 月 18 日
回复了 Ayanokouji 创建的主题 Java JDK 26 发布,非 lts 版本
向量 API 还是没孵化出来,用这玩意写了个 RAG 的玩具,速度确实可以
~/.claude.json 这个下面写了 zp mcp 了吧
1 月 26 日
回复了 xiaofire 创建的主题 职场话题 有没有面试专用的 AI?
不是现在作弊还能说的这么理直气壮?我面试都问项目经验了,还是有些脑瘫在那念 AI 人机回复,纯纯浪费时间
搭车求一个数据库分析类的 skill ,读取数据库表结构和样例数据,分析某个数据应该去哪张表拿那种
1 月 7 日
回复了 zhangsimon 创建的主题 程序员 有不受任何道德约束的混乱中立 AI 吗?
@CrowCarlos 搜了一下 abliterated 我擦好多模型,这玩意怎么做出来的,拿着善良模型用邪恶样本去微调?
2025 年 11 月 28 日
回复了 fuxintong 创建的主题 程序员 Java 开发中 怎么使用 AI?都用什么模型
模型的话开发去白嫖硅基流动的免费模型,部署就用公司内部的模型。
框架方面比起 springai 我更喜欢 langchain4j ,agent 的构建比 springai 更像 spring ,而且文档那种直接把 demo 糊脸上的感觉比 springai 含糊不清的描述舒服多了。
2025 年 9 月 23 日
回复了 Ayanokouji 创建的主题 Java JDK 25 发布了, LTS 版本
向量相关的 API 哪个版本孵化出来呀。
win10 带了这么个玩意,CPU 跑的
Windows.Media.Ocr.Cli.exe
搭车问下注册好几个 google 账号,多个 key 去调 google ai 的 api 可以么。。
啊,看到这么多用 Eclipse 快捷键的我就安心了,看公司其他同事都不用,几度怀疑我是个守旧老登。。
2025 年 5 月 29 日
回复了 VforVendetta 创建的主题 程序员 最快入门框架的方法
spring 这种一言不合就整个反射的框架难搞,前段时间想在 MCP 里自定义点东西,各种抽象层跳来跳去看得头疼,索性不看了,按 mcp 官方规范说明自己写俩接口搞定。
1  2  3  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1311 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 34ms · UTC 23:50 · PVG 07:50 · LAX 16:50 · JFK 19:50
♥ Do have faith in what you're doing.