midraos

V2EX member #703654, joined on 2024-08-01 10:50:27 +08:00

Today's activity rank 643

程序员 • midraos • Mar 11 • Lastly replied by daimaosix

程序员 • midraos • Apr 25 • Lastly replied by xixi1412

职场话题 • midraos • Jan 21 • Lastly replied by kakakakaka8889

分享创造 • midraos • Sep 24, 2025

midraos's recent replies

4h 38m ago

@diudiuu #9 直接用的 lm studio ，用的 Q6 量化，通过调整配置，将 MOE 层部署在 cpu ，通用层部署在显卡，这样做比使用低量化的效果好，比在 CPU 部署的速度快，上下文大小能达到 128k 以上，token 生成速度有 40t/s

7h 7m ago

不太准确，我在 amd 7950x + nvidia 5080 上部署的 qwen 3.6 35b a3b 模型，速度能达到 40t/s

11h 9m ago

@Poluk #2 我在 51 当天在 google play 从 plus 升级到 pro

Apr 29

auto 模式就这样，让你自己勾就不是 auto 了

Apr 28

@zsj1029 #11 应该没优化参数吧，我在 5080 上跑 35b-a3b 这个，显存只够加载一部分层，速度有 40t/s

Apr 22

@lyhiving #3 只用他的 99 一年的云服务器

Apr 21

@azraeljack #56 只用 claude code ，自建 vpn ，从来没用到过 5 小时限量。先入为主的让别人反思自己，就是拒绝接受自己不想看到的东西

Apr 21

@azraeljack #49 还真是有钱不赚，号已经被封了 3 个了，一个用了一年多，google play 订阅了半年 pro 的号被封，一个注册一周，订阅 pro 后立即封，一个注册两天没有使用过被封

Apr 15

@drbuglu #39 这样安全风险有点大了

Apr 13

还在探索，项目下放的文档太多会干扰上下文，出现 Agent 只是获取背景信息就把上下文窗口干没一半了