Flagship9945
V2EX  ›  Local LLM

需要购买国产显卡本地部署大模型,哪家的比较好

  •  
  •   Flagship9945 · 18h 50m ago · 6563 views
    • 从部署、厂商支持等角度来说
    • 200w 以内显卡预算
    95 replies    2026-06-09 01:05:13 +08:00
    Flagship9945
        1
    Flagship9945  
    OP
       18h 49m ago
    有没有有经验的老哥
    michaelzxp
        2
    michaelzxp  
       18h 46m ago
    摩尔 s5000 的 8 卡整机
    Jiajin
        3
    Jiajin  
       18h 46m ago
    昇腾 910B2
    DeYiAo
        4
    DeYiAo  
       18h 20m ago   ❤️ 1
    @Jiajin 不仅难用,而且马上就要被淘汰
    cocogovern
        5
    cocogovern  
       18h 18m ago
    这么厉害的预算,是啥应用啊
    DeYiAo
        6
    DeYiAo  
       18h 17m ago   ❤️ 5
    最合适的是 PPU 1 代,16 卡。 最近涨价了预算不知道够不够。
    PPPU 2 代,刚发布,8 卡,能买得到应该是最佳。
    考虑昇腾系列的前提是,你们技术能力极强且有 10 几人的底层工程师可以调试改 bug ,或者财大气粗让华为的工程师驻场。
    Babbitt
        7
    Babbitt  
       18h 4m ago via Android
    最近公司也有这需求,预算差不多,想部署 deepseek v4
    Flagship9945
        8
    Flagship9945  
    OP
       18h 4m ago via iPhone
    @cocogovern 这预算算少的了
    Flagship9945
        9
    Flagship9945  
    OP
       18h 3m ago via iPhone
    @DeYiAo 昇腾问题很多吗?
    yyttrr
        10
    yyttrr  
       18h 2m ago
    除了华为卡都支持 cuda,但是 cuda 版本可能很老,而且需要的一些其他基础设施要自己实现,不过有大模型写这些也不算什么难事.避坑一些特殊规格的比如一卡两芯的,选比较新的卡都差不多,海光的挺好用的
    skuuhui
        11
    skuuhui  
       17h 58m ago
    没经验不推荐国产显卡部署,坑太多了。如果非要部署建议找那种专门承接离线大模型部署业务的公司,直接上门安装包售后那种。
    Flagship9945
        12
    Flagship9945  
    OP
       17h 54m ago via iPhone
    @skuuhui 信创没办法
    Clannad0708
        13
    Clannad0708  
       17h 47m ago   ❤️ 1
    国产显卡性能差,你即使部署了本地大模型效果也远不如网页版的能力,只能说不清楚需求。
    vandort
        14
    vandort  
       17h 42m ago
    不知道你要部署什么模型,但是现在模型出的这么快,从尽可能支持最新的模型的角度来说,选显存大的,卡内带宽高的( 200W 也做不了多机互联),厂家支持到位的;符合前面三个条件下,选支持 FP8 ,最好能支持 MXFP4 的;这些都满足的情况下,选省电的,便宜的,能稳定供应的
    Flagship9945
        15
    Flagship9945  
    OP
       17h 37m ago via iPhone
    @Clannad0708 政府项目就这样,领导跟风拍板,最后往往草草了事,样子上说的过去就行。
    cpper
        16
    cpper  
       17h 30m ago
    这种部署最终都是浪费掉的,说实话
    byteX
        17
    byteX  
       17h 30m ago

    信创
    Flagship9945
        18
    Flagship9945  
    OP
       17h 27m ago via iPhone   ❤️ 1
    @cpper 整条线上的人赚钱了,😃
    strobber16
        19
    strobber16  
       17h 27m ago
    微内核
    Flagship9945
        20
    Flagship9945  
    OP
       17h 26m ago via iPhone
    有经验的老哥可以合作
    diudiuu
        21
    diudiuu  
       17h 23m ago
    看显存和带宽,合适就买
    cpper
        22
    cpper  
       17h 23m ago
    @Flagship9945 因为可以收回扣的
    cpper
        23
    cpper  
       17h 22m ago   ❤️ 2
    @Flagship9945 并不是他们蠢所以拍屁股做的决策,而是因为可以收回扣,有利益
    xiaxichen
        24
    xiaxichen  
       17h 21m ago
    我测过几家的显卡只能说阿里的 ppu 还是能用的,其他的都不太行.尤其吹的锣鼓震天响的华为.
    newaccount
        25
    newaccount  
       16h 37m ago   ❤️ 1
    政府项目不要瞎搞,你想部署哪个模型,联系对方咨询软硬件环境,人家也乐于多几个样板工程
    catazshadow
        26
    catazshadow  
       16h 33m ago via Android   ❤️ 18
    纳税人的钱就这么被烧掉了
    mingtdlb
        27
    mingtdlb  
       16h 30m ago
    国产都有哪些 GPU ?华为昇腾、天数智芯,还有哪些,海光好像也有
    cctvbnm111X1
        28
    cctvbnm111X1  
       16h 25m ago
    如果现在上项目,那必须是昇腾 950dt ,fp8 都不错了,反正有技术支持,其他几个厂都要慢的多,如果你说自己玩,那还是 ppu ,cuda 生态容易点
    whoops
        29
    whoops  
       16h 20m ago
    有信创要求,你的选择也就这九个,你可以了解一下平头哥,据说比华为的坑少一点,https://www.itsec.gov.cn/aqkkcp/cpgg/202605/t20260526_259396.html
    songray
        30
    songray  
       16h 15m ago
    国内的卡基本都是偏科的,建议先去云服务上租不同型号,把自己的 POC 跑通。
    wskymark
        31
    wskymark  
       16h 11m ago
    这东西不是只需要考虑一上指标吗?哪家有利润要哪家的
    abel533
        32
    abel533  
       16h 7m ago
    @songray 有国产卡云服务租的渠道吗?
    songray
        33
    songray  
       16h 6m ago
    @abel533 有,华为云和阿里云就可以租到两家对应的型号
    xiaomushen
        34
    xiaomushen  
       15h 58m ago
    @Jiajin 这东西只有理论算力。。。实际极难发挥
    xiaomushen
        35
    xiaomushen  
       15h 57m ago
    @cpper 又不是你口袋里的钱,有啥浪费不浪费的。哪怕外企里买了 H100 部署,你能保证大部分情况下,不是浪费么?
    google2023
        36
    google2023  
       15h 53m ago   ❤️ 1
    @DeYiAo 武汉某高校去年 4000W 用在昇腾身上,技术支持都远远跟不上
    google2023
        37
    google2023  
       15h 52m ago
    @skuuhui 麻烦推荐几家?最好有武汉的,要真正技术实力强的
    xxmaqzas
        38
    xxmaqzas  
       15h 40m ago
    我们信创项目都用的昆仑芯 P800 只能说不太好用
    find
        39
    find  
       15h 31m ago via Android   ❤️ 1
    看了好多评论,果然是殖人思想。难道一辈子都要受制于别人吗
    codingmiao
        40
    codingmiao  
       15h 23m ago   ❤️ 2
    用过海光、昇腾、平头哥。昇腾自建生态加上文档稀烂,体验就是一坨。另外两家 cuda 上能跑的代码随便改改就能跑起来,但比起 n 卡来性能和体验还是要差不少。
    cpper
        41
    cpper  
       15h 9m ago   ❤️ 6
    总有些人以为是在创新和防止卡脖子,其实背后全是利益和勾兑
    cpper
        42
    cpper  
       15h 9m ago   ❤️ 2
    @xiaomushen 我每年个人所得税交几十万,还不能关心下蛀虫浪费税收了?
    cpper
        43
    cpper  
       15h 8m ago
    有些人揣着明白装糊涂,信创都是些什么东西心里没点数吗
    Flagship9945
        44
    Flagship9945  
    OP
       15h 7m ago via iPhone
    产品选型,不涉及其他的~~
    cpper
        45
    cpper  
       15h 6m ago   ❤️ 10
    @xiaomushen 外企就是把买的卡扔到水坑里都无所谓,只要不是花的税收的钱。但信创的那些单位花的钱来自于哪里你心里没数?
    jacketma
        46
    jacketma  
       14h 46m ago
    网上不是爆昇腾 910b 、910c 都是 TSMC 代工的 7nm 么(算能科技发包),工艺品控应该可以,就看你这边部署能不能适应软件生态了
    EngelEyes
        47
    EngelEyes  
       14h 39m ago
    七彩虹🐶
    abel533
        48
    abel533  
       14h 22m ago
    @songray #33 这两家找过多个入口,都看不到能选 GPU 的地方。。想从头在一台机器部署大模型测试,方便提供一个选择型号的入口界面吗?问过 AI ,说有,根据步骤走不通。
    murmur
        49
    murmur  
       13h 30m ago
    阿里 平头哥
    jokechen
        50
    jokechen  
       13h 29m ago
    昇腾 910c 部署 deepseek 遇到了一个 bug ,直接影响使用,还是要谨慎些。
    https://github.com/vllm-project/vllm-ascend/issues/9170
    songray
        51
    songray  
       13h 22m ago
    @abel533 华为云选购买弹性云服务器,区域选华北三。

    找不到是因为限购,要用公司的账号找客户经理申请。
    CloudnuY
        52
    CloudnuY  
       13h 1m ago
    平头哥也有坑,vllm 镜像只能用内部分发的,启动之后模型时不时出现各种问题(循环、无法调用 tool 、思考链无法控制、答非所问等等)
    abel533
        53
    abel533  
       12h 0m ago
    @songray #51 切换不同区能看到带 GPU 的机器,都是 NVIDIA Tesla ,没有国产卡。想适配国产卡很难,卡也不好买。

    a791633597
        54
    a791633597  
       11h 36m ago
    阿里华为我这边都做,部分卡要后台申请开白才能看到,有兴趣可以聊聊
    v:dmzzx123
    cubecube
        55
    cubecube  
       11h 33m ago
    @xiaxichen 因为 ppu 阿里自己也在吃狗粮,nv 的卡不够,qwen 大规模使用 ppu
    cubecube
        56
    cubecube  
       11h 32m ago
    @abel533 #53 你要联系销售沟通,现状是卡不够,不卖散户的
    Liftman
        57
    Liftman  
       11h 23m ago
    如果是有特定的项目,而不是单纯的部署算力需求,我建议你找一家,做成产品,单兵化的设备,他封装好。这样你不需要解释里面是什么牌的算力。。。
    elehayym1618
        58
    elehayym1618  
       11h 17m ago   ❤️ 3
    昇腾,kunlun ,ppu ,海光,燧原我都适配过,说实话纯粹就是浪费纳税人的钱,适配这些东西你的狂躁程度会高的离谱,各种你想象不到的问题,而且也没有渠道解决。
    比如 kunlun ,他们的 vllm 还是基于 0.15.x 打补丁的,很多新的模型都不适配,然后有些量化的 config 也没有人写,但自己改吧改吧也能用。
    昇腾是纯垃圾的骗钱玩意,我都不知道这东西他们自己有没有测试过,对着官方文档都起不来。他们那个 mindie ,cicd 肯定是没有的,上个版本还能跑的东西新版本就跑不了了,硬件也垃圾,动不动就掉卡,买这个就是纯粹给他们当免费测试当小白鼠。
    xiaomushen
        59
    xiaomushen  
       11h 14m ago
    @cpper 关心就关心呗,那你能说服北京那边,要求信创单位购买 N 卡么?
    xiaomushen
        60
    xiaomushen  
       11h 11m ago
    @cpper 信创不见得是蛀虫,而是属于没办法。要么让我国放弃国产化诉求,放弃和华盛顿对抗。要么只好捏着鼻子用现阶段的信创产品。有啥办法呢?

    反过来说,谁不想用 N 卡呢?
    xiaomushen
        61
    xiaomushen  
       11h 6m ago
    @elehayym1618 昇腾的理论算力只能用在静态图上,比如 TensorFlow,Yolo 上。对付 LLM 这些动态玩意儿,真的无解
    Flagship9945
        62
    Flagship9945  
    OP
       11h 5m ago
    @elehayym1618 #58 老哥有兴趣加微信吗,后续有机会可以合作。
    zcj920
        63
    zcj920  
       10h 50m ago
    910B 单机 GLM5 Q8 只有 20tps
    xiaxichen
        64
    xiaxichen  
       10h 25m ago
    @zcj920 20 tps 也太离谱了
    wildwind2333
        65
    wildwind2333  
       10h 23m ago
    平头哥 PPU 好点 但也一堆问题,还必须阿里工作人员去适配模型,自己目前拿不到测试服务器去适配
    xiaomushen
        66
    xiaomushen  
       10h 21m ago
    @xiaxichen GLM5 ,MoE 744B ,激活 40B ,Q8 部署,单卡显存倒是能满足了。这速度嘛。。。很符合昇腾的实际表现
    xiaxichen
        67
    xiaxichen  
       10h 17m ago
    @xiaomushen 那还有啥用 都不如直接买充钱买 api 了
    wanghanthu
        68
    wanghanthu  
       10h 11m ago
    200W 还是买 token 吧,这点钱不够硬件厂商技术支持费用的,新模型出来打算自己 debug 吗?
    xiaomushen
        69
    xiaomushen  
       10h 4m ago
    @xiaxichen 涉密单位不允许连外网呗
    xiaxichen
        70
    xiaxichen  
       9h 58m ago
    @xiaomushen 我看阿里云有那种 tokenplan 企业版说是不用回答作为训练数据 这种单开 url 通过应该可以吧
    xiaomushen
        71
    xiaomushen  
       9h 54m ago
    @xiaxichen 没用,涉密单位不能连外网,物理隔离的。所以才需要本地信创算力。
    真的是一言难尽啊,再说了,正规渠道层面,老美也严禁出售计算卡给那些单位,抓到后,全球追捕全链路经销商,也是神经病。。。
    yinanc
        72
    yinanc  
       9h 41m ago
    感觉这个帖子的讨论很有价值
    Jiajin
        73
    Jiajin  
       9h 21m ago
    昇腾 910B2 、海光 K100AI 都用过,推荐昇腾 910B2 。950 我不推荐是因为你 200 万买不了 8 卡

    910B2 是能用的。勉强能用的那种。
    JoveYu
        74
    JoveYu  
       9h 4m ago
    别说国产了,玩 AMD 用 ROCm vLLM 也是差不多的体验
    pepesii
        75
    pepesii  
       9h 0m ago
    @elehayym1618 kunlun ,确实是一坨!文档压根走不通!
    mofash
        76
    mofash  
       8h 15m ago   ❤️ 1
    @find #39 粉蛆又破防了,一坨翔逼着让你吃,你还的非说香?
    VeteranCat
        77
    VeteranCat  
       8h 5m ago
    别折磨自己, 这些国产显卡的技术支持你个人是获取不到的, 个人使用最好跟着社区的支持来,cuda 是你的唯一稳妥选择,ROCm 你都会和吃粑粑一样难受的。
    MarioBros
        78
    MarioBros  
       8h 2m ago
    #find #39
    让我想起了光刻机
    runzekk
        79
    runzekk  
       7h 3m ago   ❤️ 1
    真是一堆想润海外,别人都不要的。也就是在国内大家技术素养还不高,没有给一些智商情商有问题的淘汰掉。
    真是不知道搁这口嗨能有什么意义,一个正常适配模型的帖子也能键政,看着都恶心。
    本来对键政是中立的,没有观点的,看了这么多无脑喷子都开始反感键政的了。
    有什么想法就去提,想做什么事就去做,实在不行直接润,搁这影响别人心情。
    raycool
        80
    raycool  
       6h 26m ago
    阿里的平头哥~
    xiaomushen
        81
    xiaomushen  
       6h 23m ago
    @runzekk 也不能这么说呀。总归吐槽吐槽咯,虽然从国家安全的角度上说,能理解信创。但此刻国产计算卡实在是太难用了。而且尤其是 NPU 线路的,当下的昇腾卡,搞基于动态图的 LLM ,哪怕是做推理,也是接近扯淡的存在:累死 AI Infra 打工仔

    PS:也理解西大不允许用 Huawei 的通信设备---国安角度
    xiaomushen
        82
    xiaomushen  
       6h 22m ago
    @VeteranCat 国安,涉密,信创。这样的大前提下,就别想 N 卡了。捏着鼻子搞国产卡叭...
    xiaomushen
        83
    xiaomushen  
       6h 20m ago
    @runzekk 又不是搞 LLM 底层的清北本硕,普通码农打工仔,润出去也没人要啊,只能和老墨一起修草坪
    jetsung
        84
    jetsung  
       6h 10m ago
    说是 8 月份上 950DT 。前两天看到新闻说 哈工大深圳 + 华为,还有一个忘记是哪个单位了,联合搞出了个支持 deepseek v4 pro 的。v4 flash 已经支持了。AtomGit 上面有看到
    https://ai.atomgit.com/models?ascendNative=true&ascendEcosystem=true
    Flagship9945
        85
    Flagship9945  
    OP
       5h 37m ago via iPhone
    @Jiajin 部署起来是不是很麻烦?
    Mandelo
        86
    Mandelo  
       5h 36m ago
    都信创了,还管啥好不好,重要不是结果,而是花经费写 PPT
    HojiOShi
        87
    HojiOShi  
       5h 31m ago
    之前把玩过摩尔线程的卡,跑了一下 llama.cpp ,只能说就是纯电阻丝,毫不夸张。然后它那点可怜的 MUSA SDK 还要登录才能拿到手。
    raycool
        88
    raycool  
       5h 6m ago
    @jetsung 这个估计今年根本买不到,不用想了
    mmdsun
        89
    mmdsun  
       4h 40m ago
    你们是做开发?还是只是部署模型?

    我们公司买的昇腾 910B ,先开始的 docker 都拉不下来 一看是内网的。。
    后面就给个了镜像导出的才部署好。不过好在用着没什么问题 qwen\deepseek 都本地部署过。
    Flagship9945
        90
    Flagship9945  
    OP
       4h 39m ago
    @mmdsun #89 我们只要部署好就可以了
    smlcgx
        91
    smlcgx  
       4h 16m ago
    这个数感觉是写材料用的,试试华为那边能不能梭哈了,你跟领导都省心
    zhanying
        92
    zhanying  
       4h 15m ago
    @Flagship9945 910 系列问题很多,只支持 SIMD
    ezwangsong
        93
    ezwangsong  
       3h 56m ago   ❤️ 1
    信创项目选型,图省心直接上**阿里平头哥 PPU**。从帖子里看,PPU 至少延续 CUDA 生态,模型改改就能跑,内部也在吃自己的狗粮,比昇腾的闭门造车强多了。

    如果领导点名或只为交差,那就**华为昇腾 910B2**。虽然大家都说文档稀烂、动不动掉卡,bug 也多,但这是政治正确的最优选,且华为有驻场工程师能给你兜底,这 200 万里必须含原厂技术支持的费用。

    最后提醒一句:**先别急着买,去阿里云或华为云租几块同型号的卡跑一遍**。国产卡兼容性看命,只有自己实测能跑通你要的模型,这钱才不算白烧。
    xiaomushen
        94
    xiaomushen  
       2h 52m ago
    @zhanying 那玩意儿就是个大号 NPU ,根本不适合跑动态图的 LLM 。950 倒是改成 SIMT 了( GPGPU ),还号称兼容 CUDA ,不知道效果咋样。

    我觉得 910 就是 HW 抄袭寒武纪 NPU 后,最终的进化形态。结果发现 NPU 这条楼基本是死胡同,一咬牙改换门庭,走 SIMT 路线
    ludyleocn
        95
    ludyleocn  
       2h 34m ago
    又学到东西了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   966 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 142ms · UTC 19:39 · PVG 03:39 · LAX 12:39 · JFK 15:39
    ♥ Do have faith in what you're doing.