百度系
PaddleOCR
PaddleVL
PaddleStructure
QianFanOCR
QianFanOCR fast
Paddle 和 QianFan 系不知道有什么区别
Deepseek 系
DeepseekOCR 不支持 latex 公式
智谱系
GLMOCR 好像输出直接能对齐 PaddleOCR PaddleVL PaddleStructure 这 3 个加一起的输出能力
GLMOCR 是按照 token 计费的,0.2 元/M token
PaddleOCR QianFanOCR QianFanOCR fast DeepseekOCR 也都是 token 计费,但是都比 GLMOCR 贵
PaddleVL PaddleStructure 是按照 0.09 元/页计费的
GLMOCR 性能好,也便宜
最后我给 extractfromimg 使用 GLMOCR 来做 OCR 识别