Raven316
V2EX  ›  问与答

有没有懂泰语的 v 友

  •  
  •   Raven316 · Feb 27, 2020 · 2000 views
    This topic created in 2287 days ago, the information mentioned may be changed or developed.
    公司让做泰语的 ocr,现在用的是 crnn 模型,问题在于没有一个泰语的训练集。在网上查了下泰语的基础,见这两篇文章:
    https://blog.csdn.net/cbbbc/article/details/47022337
    https://blog.csdn.net/qiaojiongzeng6321/article/details/74857285

    crnn 的训练集要求是一个序列图片,并给定相应的标签

    由于泰语的复杂性,考虑了两种方案
    1unicode 当做标签,这个方案已经被证明不可行,会输出很多不合法的泰语字符(如孤立的上标,下标等)
    2 所有合成过的泰语字符当做标签(加上上标,下标之后的所有可能),问题在于不知道合成后的泰语合法字符有多少种。有没有 v 友指导一下
    4 replies    2020-02-27 14:21:28 +08:00
    18115692244
        1
    18115692244  
       Feb 27, 2020
    这个问题一下子就触及了 v 友们的知识盲区
    cuixiaoyan
        2
    cuixiaoyan  
       Feb 27, 2020
    萨瓦迪卡
    Whsiqi
        3
    Whsiqi  
       Feb 27, 2020 via Android
    外包给泰国程序员吧
    mikulch
        4
    mikulch  
       Feb 27, 2020
    ?斧王头像竟然做的是这种活,还挺高端的。打破了我的印象。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1135 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 46ms · UTC 23:03 · PVG 07:03 · LAX 16:03 · JFK 19:03
    ♥ Do have faith in what you're doing.