请教下国内模型大部分都不支持结构化输出,普通的问答倒是无所谓,开发上做一些结构化入库有什么好方法呢,有结构化输出之前,我是直接字符串截取。
比如:从对话中提取用户的姓名,放到 name 字段入库。 还有特别 sb 的是模型会回复:好的,我不输出其他内容直接给你输出 {name:xxxx}
还有像 codex 和 cc 这种需要完全准确的代码和指令的,会需要结构化输出吗?
1
Yasuke 11 小时 8 分钟前
没有 schema ?
|
2
yuewolf 11 小时 7 分钟前
啊?大部分模型都支持的吧。一般都有个参数。 "response_format": { "type": "json_object" }
|
3
pagxir 11 小时 5 分钟前 via Android
应该是你给的提示词不对吧
|
4
horizon 11 小时 3 分钟前
应该是你搞错了,你用 api 试试
|
5
Muniesa 11 小时 1 分钟前
|
6
gorvey 10 小时 55 分钟前
这是从 gpt 初代的时代大部分模型都支持的功能,现在的国模不可能不支持
|
7
yangfan1999 10 小时 53 分钟前
现在的 deepseek/kimi 都可以支持结构化输出了,基本不会碰到结构化数据解析异常导致的报错。不能结构化输出的都是之前的一些老模型,例如:gpt-4o-min ,不能稳定输出 JSON 。
|
8
Seayon 10 小时 52 分钟前
如果是在两年前你提出这个问题我觉得还合理。。
|
9
ddczl 10 小时 47 分钟前
是支持的,我现在有写工作都是直接让其整理,只是提示词要明确,类似于这种:
## 操作流程 1. ... 2. ... 3. **结构化输出**:按照提供的`API 数据结构`定义和必填字段要求生成 JSON 。 ## API 数据结构 #### 共性指数 用于说明该场景是否常见 | 字段 | 类型 | 说明 | | ------------------------ | ------ | ---------------- | | `commonIndex` | number | 共性指数 (0-100) | | `commonIndexDescription` | string | 共性指数说明 | #### 嵌套对象 **timelines** (时间线列表): ```json { "date": 1609459200, "title": "事件标题", "description": "描述" } ``` |
10
iSNN OP 一来就是“大部分”措辞说的不太准确抱歉,QWen 和 GLM 确实都支持了。
豆包最新 2.0 开倒车不支持,百度平台支持的是 Deepseek 和 QWen 文心没看到,minimax 我看到说只有 MiniMax-Text-01 支持,腾讯混元没找到相关文档。 我们接的模型也很多用的也很多,只是今天刚好做一个业务调到了豆包 2.0 发现不支持,然后大概浏览下发现支持情况居然参差不齐,我们也是从 gpt3.5 一路接过来的,只是好奇下 |
11
yangyaofei 9 小时 31 分钟前 用 pydantic-ai 或者它的逻辑, 他默认的输出结构化是使用工具调用实现的, 你也可以这么做或者直接用它. 不支持工具调用的模型估计就不可能存在了.
具体详情你可以看他的文档 |