求本地部署的 AI 推荐~

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 250 天前的主题，其中的信息可能已经有所发展或是发生改变。

如果我想搞一个本地部署的 AI ，喂给它公司产品的所有资料，比如说明书之类的 PDF,PPT ，达到一个知识库的作用，有什么推荐吗？能详细一点最好，谢谢。
最好也有硬件的大概需求。
大概有 1-200 个产品。

11 条回复 • 2025-06-01 20:36:08 +08:00

iv8d

2025 年 5 月 30 日

ollama

murmur

2025 年 5 月 30 日

200 个产品本地部署你得几套 deepseek 才够用哦

coefu

2025 年 5 月 30 日

很拉，没效果的。

dualist

2025 年 5 月 30 日

你要做的是把知识库的每个文件元数据提取出来，然后存到 db 或者非关系数据库，暴露个接口参数让 AI 调用搜索结果，解析结果返回数据就行而不是全部喂给 AI

zxcvbnm001

2025 年 5 月 30 日 via iPhone

可以选择 rag ，目前看微调还是不如 rag 稳定

luny

2025 年 5 月 30 日

ollama+dify

444571840

2025 年 5 月 30 日

本地 AI 不是特别推荐，当玩具玩玩可以，生产力就算了

YsHaNg

2025 年 5 月 30 日

@murmur 不是啥玩意为啥要 duplicate deepseek ？模型权重还有按套算的？

murmur

2025 年 5 月 31 日

@YsHaNg 国内现在买不到那种非常强的推理卡吧，你想跑并发不就得多部署几套

YsHaNg

2025 年 5 月 31 日 via iPhone

@murmur pcie 槽够多就行 200 也不是很大多插点卡完事这里也没什么并发需求重要的是权重+上下文能塞进显存里 r1 模型卡 128k 属实不适合干这种事实际召回率更低

happybabys

2025 年 6 月 1 日

模型没有最强的，只有最适合的，本地部署是正确的选择