heyhumor

CRNN 模型的大佬们请进。。。

  •  
  •   heyhumor · Jan 6, 2020 · 2486 views
    This topic created in 2339 days ago, the information mentioned may be changed or developed.

    最近在做基于 CRNN 模型的 OCR 识别引擎,做的是日语的识别,语料来自要处理的汽车行业数据。过程比较顺利,用自动生成的 100w 数据集进行训练,验证集也有 98%以上的正确率。但是在实际材料中表现不佳,错误比较多。模型的泛化用了 8 种字体,10 种背景以及模糊,倾斜和一些随机噪声。实际选取测试的材料清晰度也很高,不存在没有对应字体,清晰度低这类问题。想请教一下还有其他的什么原因导致实际场景印刷体识别效果差呢?

    2 replies    2020-06-19 09:54:14 +08:00
    csuyzt
        1
    csuyzt  
       Jun 13, 2020
    生成的数据与实际数据像么?自动生成的大概逻辑是怎样的?
    heyhumor
        2
    heyhumor  
    OP
       Jun 19, 2020
    @csuyzt 谢谢回复,确实是泛化没做好。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5672 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 01:29 · PVG 09:29 · LAX 18:29 · JFK 21:29
    ♥ Do have faith in what you're doing.