年前提前一周请假溜了,这十来天彻底断网没看任何技术群。今天开工第一天,赶紧边摸鱼边理了一下“补课”清单,顺便求佬们给同步下最新进度,有没有什么要避坑的?
1
thevenin1416 OP 关于这些疑问等,我打算先问问 AI!看他怎么回答
|
2
iorilu 20 小时 21 分钟前
ai 更新天天有, 过去的不用关注
|
3
thevenin1416 OP @iorilu 不是更新,你得知道更新后的最佳实践呀!
|
4
root71370 20 小时 7 分钟前 典型的 fomo
|
5
thevenin1416 OP |
6
iorilu 19 小时 29 分钟前
@thevenin1416 我意思是现在不用关注一周前的东西, 你只需要知道昨天的新闻就行
|
7
coefu 19 小时 28 分钟前
@thevenin1416 #3 这些东西,一直迭代,了解细节就是徒耗精力。最没有用的就是这些应用的使用细节和所谓的性能。真正有用的是,新的原理研究进展(生成模型的架构演进迭代更新,注意力机制的新花样,记忆机制的新花样......),不过这些粗略瞥一眼已经是对它们最大的尊重了。
|
8
thevenin1416 OP @coefu 问题是我只是一个应用者呀,没有那么 NB 到去搞 AI 底层的东西呀,没办法!我要是厉害到去玩那种底层的,我早就不在这个公司混着了
|
9
Hyxiao 16 小时 1 分钟前 其实不太追的这么紧,稍微放松下。而且今年春节 AI 的新闻也不算多,最炸裂的应该还是字节的即梦 2 视频生成吧,其次 sonnet4.6 出来了,还没用,目前在用 opus4.6 ,其实区别也没感觉有多大,然后 Gemini 的模型好像也更新了吧,包括智谱和 kimi 新推的模型都没怎么用,玩不过来,太累了。
今天在这个帖子( https://www.sunp.eu.org/t/1192730 )上学到一句话,信号与焦虑的比例很重要。如果一个信息流让你感觉落后而不是见多识广,它对你并无益处。 |
10
thevenin1416 OP 问题是如果别人的生产力提高了,别人一天干 1 小时,而你干一天,这明显是不合理的,不存在焦虑,但要跟的上时代
|
11
abram 15 小时 46 分钟前
怎么白嫖 glm
|
12
rb6221 15 小时 40 分钟前
你提醒了我,我直接去问了 gemini ,让他帮我总结过去两周的新闻。你也可以试试
|
13
bojue 15 小时 34 分钟前
@thevenin1416 #10 现在哪个 ai 能一周拉开这么大的差距,提高一倍都没见过
|
14
kafei0421 15 小时 30 分钟前
可以给 grok 添加相关的 task ,每天收集 x 上的信息整理一份 AI 相关的 newsletter
|
15
thevenin1416 OP @bojue 没有那么夸张,但是差距真实存在!
|
16
thevenin1416 OP @abram 便宜无好货,出点米用的心安理得,还是推荐进口货!
|
17
thevenin1416 OP @rb6221 兄台同步下结论下,多 AI 平台看看,要的是提炼后的结论
|
18
silencelixing 14 小时 50 分钟前 via Android
国内的模型任选,都一样,都是蒸馏的 claude
|
19
thevenin1416 OP @silencelixing 说是这样说,那我直接用进口货不香么?贵有贵的道理,模型只是一方面,怎么配置,达到最优解是个问题!
|
20
lautayfir 13 小时 52 分钟前
春节假期后,AI 圈子最近 30 天(约 1 月底至 2 月底)密集发布了多款重磅模型和工具更新,中国厂商如阿里 Qwen3 系列和智谱 GLM 5.0 领跑本土赛道,国际上 Anthropic Claude 4.6 和 OpenAI GPT-5.3-Codex-Spark 等引发热议。 [hub.baai.ac]( https://hub.baai.ac.cn/view/52682)
## 最近 30 天 AI 大事 - 中美模型对撞:1 月 15 日阿里 Qwen3-Max 升级推理,Google Gemini Personal Intelligence 和 Anthropic Cowork 同期发布; 1 月底中美厂商 24 小时内亮剑视频生成(字节 Seedance 2.0 )、深度推理( Google Gemini 3 Deep Think )和具身智能(小米 Xiaomi-Robotics-0 )。 [hub.baai.ac]( https://hub.baai.ac.cn/view/52682) - 2 月 5 日 Anthropic 发布 Claude Opus 4.6:100 万 token 上下文、企业级 agent teams ,基准测试超 GPT-5.2 ( Terminal-Bench 65.4%),定价不变($5/$25 每百万 token )。 [unifuncs]( https://unifuncs.com/s/Ekn9vcNO) - GLM 5.0 上线:开源 SOTA ,支持 OpenClaw 部署,新用户阿里云免费额度白嫖,结合 3000+Skill 资源实战强。 [blog.csdn]( https://blog.csdn.net/weixin_45871766/article/details/158103406) - OpenAI GPT-5.3-Codex-Spark 和 Codex App:多 agent 并行开发,用 worktrees 避冲突,macOS 免费,1M+开发者活跃。 [nxcode]( https://www.nxcode.io/zh/resources/news/openai-codex-app-review-2026) - 其他:月之暗面 Kimi K2.5 开源、DeepSeek-OCR 2 视觉编码; Anthropic 指控 DeepSeek 抄袭遭马斯克反击。 [k.sina.com]( https://k.sina.com.cn/article_7857201856_1d45362c001902krze.html) ## 模型选型与白嫖 Claude 4.6 逻辑更强于 4.5 ,尤其复杂架构/业务分析( Terminal-Bench 领先),但代码质量有争议(部分用户偏好 4.5 的稳定,可用/claudeus--5 回滚);非代码任务跨领域思考提升明显。 [reddit]( https://www.reddit.com/r/ClaudeAI/comments/1qyl78h/claude_opus_45_better_than_46/) GLM 5.0 是白嫖首选:智谱平台注册 API-Key 免费额度,OpenClaw (阿里云香港/新加坡部署)极速接入,支持飞书等;避坑:选 2vCPU+4GiB 配置防卡顿。 [developer.aliyun]( https://developer.aliyun.com/article/1712391) Codex API 代理:稳推官方 Codex App (免费 macOS ,GPT-5.3 支持 30min 长任务); Claude Code 营收$1B ,代码质量顶尖($20/mo )。火山中转到期后,优先 OpenClaw/GLM 5.0 。 [nxcode]( https://www.nxcode.io/zh/resources/news/openai-codex-app-review-2026) ## IDE 升级要点 | IDE | 最近更新( 2026 年 1-2 月) | 主力地位 | |----|-------------------------|----------| | Cursor | CLI 计划云端执行、内联 ASCII 图,Composer 多文件编辑标杆,360K 用户 | 日常编程/行业标杆,年费$240 但 AI 天花板( Claude+GPT 双引擎) [cursor]( https://cursor.com/cn/changelog) | | Antigravity (Google) | 配额波动( 150 次/5h 刷新),Agent Skills 支持(知识外置化),Gemini 3 集成 | Agent 优先,Pro/Ultra 用户高配额,避坑:沙箱测试 Skills [bilibili]( https://www.bilibili.com/video/BV13UrKBuEEf/) | | Windsurf | Arena Mode 侧边模型对比、Cascade 代理并行、GPT-5.1-Codex 默认(变量思考深度),Supercomplete Tab 补全 | 工作流优化强,付费订阅 Gemini 3.1 Pro/Claude 4.6/GLM-5 [windsurf]( https://windsurf.com/changelog/windsurf-next) | | Trae | UI 交互优化、CUE 编辑预测/Tab 、Git Commit AI 生成、VSCode 1.104 内核 | 国货黑马,50%价格 80%体验,Remote SSH 快 [w3cschool]( https://www.w3cschool.cn/traedocs/trae-changelog.html) | 大家主力仍是 Cursor ( AI 能力最强),Windsurf 卷 Vibe Coding ( Arena 对比你的代码库)。 [aicoding.csdn]( https://aicoding.csdn.net/6971a456a16c6648a984345d.html) ## CLI 与工作流实践 Claude Code 2.1 ( 1096 commits ):异步子代理、Skills 热重载、会话传送,并行开发时代。 [help.apiyi]( https://help.apiyi.com/claude-code-2-1-release-features.html) OpenCode v1.2.10:Sonnet 4.6 支持、Julia LSP 、TUI 性能优化、Codex 模型列表改进。 [opencode]( https://opencode.ai/zh/changelog) Superpowers ( TDD 铁律):支持 Claude Code/Codex/OpenCode ,苏格拉底需求厘清、隔离分支、13 子 agent 任务、零报错 iOS App 示例; Oh My OpenCode v3.5.6 ( 2/15 ):Gemini 提示优化、auto-update 安全、subagent 防僵尸,支持大规模重构。 [youtube]( ) 最佳实践:Superpowers+Oh My OpenCode 强制 TDD ,上规矩防屎山;安装 Claude Code 一键,优先 Opus 4.6 effort=max 。 [github]( https://github.com/code-yeongyu/oh-my-opencode/releases) ## 高强度补课资源 B 站“AI 超元域”/“技术爬虾”最新:OpenClaw 部署攻略、Cloud Bot ( OpenCode 变体)定时任务/浏览器自动化/GitHub 热点简报,点赞收藏视频实战。 [douyin]( https://www.douyin.com/shipin/7605043744437749806) V 站/L 站盯盘:优先 hub.baai.ac.cn 中文 AI 汇总、Reddit r/ClaudeAI/Claude 4.6 讨论、GitHub oh-my-opencode releases 、Cursor/Windsurf changelog 。 [windsurf]( https://windsurf.com/changelog/windsurf-next) 开工摸鱼顺序:先刷 B 站 UP 主视频→更新 CLI/IDE→白嫖 GLM 5.0 OpenClaw 测试 Superpowers TDD→追模型基准( Claude 4.6 vs 4.5 )。 [douyin]( https://www.douyin.com/shipin/7605043744437749806) |
21
thevenin1416 OP @lautayfir 兄弟有心了,我先去看看这些实践是否科学靠谱,再给大家留言!
|
22
encro 12 小时 43 分钟前
我试了下 opus 4.6 和 4.5 都没感觉啥出来。
codex-5.3 也感觉不大。 gml 5 ,qwen 3.5 之类的我打个问号。 |
23
lete 12 小时 40 分钟前
|
24
AEnjoyable 12 小时 21 分钟前
卷不动了 我才刚接触 skill
|
25
thevenin1416 OP @lete 只讨论技术本身
|
26
Kinnice 12 小时 3 分钟前
一句话: 用最牛 B 的模型就行了。
|
27
thevenin1416 OP @Kinnice 并不认同,各种 mcp skills ,sub agent 干什么吃的,另外,这个属于高消费
|
28
Kinnice 11 小时 37 分钟前 via Android
@thevenin1416 春节假期中有关于这些的迭代?
|
29
anonymous00 1 小时 39 分钟前
@thevenin1416 #21 这么一句话,就够你忙一阵的,呵呵…
|