使用本地模型 Gemma4 来驱动 OpenClaw - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

替换下面指令中的 model ID 为你本地 Ollama 里启动的版本。

openclaw onboard --non-interactive \
  --auth-choice custom-api-key \
  --custom-base-url "http://127.0.0.1:11434/v1" \
  --custom-model-id "gemma4:31b-it-q4_K_M" \
  --custom-api-key "ollama" \
  --secret-input-mode plaintext \
  --custom-compatibility openai \
  --accept-risk

26 条回复 • 2026-04-05 06:14:54 +08:00

1

0U0

22 小时 38 分钟前

需要什么配置才能跑得动

2

Livid

MOD

OP

PRO

22 小时 36 分钟前

@0U0 这里有不同版本，应该总有一个是本地能跑起来的：

https://ollama.com/library/gemma4/tags

3

Visoar

PRO

22 小时 29 分钟前

Google 搞了个 `Google Al Edge Gallery`，在 iPhone 上直接跑起 e2b/e4b 版本 Gemma4 ...
试了 e2b 速度很好很顺畅，能力也不错.

看起来今年端侧小模型要开始卷了

4

pkuphy

PRO

22 小时 17 分钟前 via iPhone

这个模型真的好用

5

senooo

22 小时 12 分钟前

手机上的 e2b 2G PC 端的 e2b 7G

6

CatCode

21 小时 55 分钟前

@Visoar iPhone 13 提示内存不足。iPad 倒是跑起来了，就是 UI 比较蛋疼。

7

v2gba

21 小时 53 分钟前

站长这个得 30+的内存才能跑了吧？

8

zivn

21 小时 20 分钟前

32G M3 Pro 不论用 mlx 还是 ollama 跑 31b 基本没法用。
聊天可以，openclaw 直接卡死。
虽说理论上只要 20G 内存，但 openclaw 上下文太长了，预填充要几分钟甚至十几分钟。
26b 是 MOE 就没试了，感觉还是 Dense 才有前途。

9

zivn

21 小时 16 分钟前

mlx 版本在 huggingface 上，mlx-community/gemma-4-31b-it-nvfp4 ，需要用 mlx-vlm 运行。

10

huanxianghao

20 小时 48 分钟前

很棒。
在 windows 上面跑了，4070s 跑 26b ，感觉思考时间有点长

11

paranoiagu

20 小时 35 分钟前 via Android

龙虾的上下文太长了，我 24G 显卡，跑 27B 的 qwen3.5 ，开了 64K 上下文，再大就爆显存了。但是 64K 龙虾不够。

12

chipipi

20 小时 23 分钟前 via Android

目前什么设备能跑得动？

13

dinjufen

20 小时 19 分钟前

16G 内存的 mac mini m4 能跑动吗

14

zoozobib

20 小时 18 分钟前

测试 qwen3.5-27b q4 和 gemma4-31b q4 。200K ctx 同样的代码问题，后者一把过，测试用例还是少

15

zoozobib

20 小时 18 分钟前

但前者能跑到 38 /t 后只能到 33/t

16

levn

19 小时 10 分钟前

27b q4 使用 32G 显存，就可以开 200k 上下文
31b q4 使用 64G 显存，kv q8 量化都开不到 100k 上下文

17

crocoBaby

18 小时 6 分钟前

能用度如何？

18

learnshare

18 小时 5 分钟前

16G M2 Mac mini 勉强能跑起来低配两个版本，但仅能跑起来，没啥可用性
以后得买 64G 版本玩一玩了

19

sickoo

17 小时 53 分钟前

@dinjufen 跑 mlc 吧

20

zoozobib

17 小时 28 分钟前

新测，加了 2b 的 draft , 提升到 45/t ;Draft 接受率不错，5 成

21

fs418082760

11 小时 50 分钟前

据说不如 qwen3.5

22

hanguofu

6 小时 34 分钟前

值得期待 ~

23

cskeleton

5 小时 26 分钟前 via iPhone

@zivn 跑 dense 长上下文估计得 128G 才能畅玩

24

c0xt30a

2 小时 43 分钟前

我用微调版 Qwen3.5 的经验是：只要虾虾不试图修改代码错误，运行还算顺利。技能运行不成功修改代码的时候，有很大的几率把自己搞瘫痪。

25

Livid

MOD

OP

PRO

2 小时 17 分钟前

@crocoBaby 我还在测试，目前是用来替代了一个之前使用 Opus 4.6 的环境（因为之前的第三方 Claude API 服务商挂了，你知道的那家）。

Gemma4 有两个相对较大的版本，31b 和 26b ，26b 目前试下来会快很多。

26

Livid

MOD

OP

PRO

1 小时 55 分钟前

@crocoBaby 在 Planet 里集成的效果，感觉已经能做一些有意义的分析和对话了：

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 3491 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 23ms · UTC 00:09 · PVG 08:09 · LAX 17:09 · JFK 20:09
♥ Do have faith in what you're doing.