https://huggingface.co/Qwen/Qwen3.5-35B-A3B
vLLM 部署的话,需要用 uv 安装一个 nightly 版本(正常 pip install vllm 的 0.15 版本用不了):
pip install uv
uv pip install -U vllm --torch-backend=auto --extra-index-url https://wheels.vllm.ai/nightly
1
tthem 11 小时 5 分钟前
m2max 64GB 内存,能跑的起来吗
|