justfly
V2EX  ›  问与答

大家有没有靠谱的脏话词库?

  •  
  •   justfly · Oct 30, 2013 · 11896 views
    This topic created in 4590 days ago, the information mentioned may be changed or developed.
    工作中要对用户的提交信息做脏话过滤,在谷歌搜敏感词库大都是针对政治方面啊历史啊方面,搜到的discuz论坛的屏蔽词库也不全,连经典国骂都没有。

    大家有没有靠谱的脏话词库啊?
    justfly.py(#)gmail.com

    不胜感激!:)
    10 replies    1970-01-01 08:00:00 +08:00
    tanny
        1
    tanny  
       Oct 30, 2013
    中文裡頭同音字太多,過濾,只會衍生更多新詞語。
    inee
        2
    inee  
       Oct 30, 2013
    我也需要。

    要是真的生活中骂人的

    还要分各种地区,男生骂和女生骂的区别。
    比如,苏淮一代,吴语方言
    上海的
    武汉的,天津的,北京的。安徽的,河南的

    目前没有满意的
    n0b0dy
        3
    n0b0dy  
       Oct 30, 2013
    ri cao gan 这个必须要分词啊
    gangsta
        4
    gangsta  
       Oct 30, 2013   ❤️ 1
    你试着google下 filetype:txt banwords.txt
    http://www.house365.com/houseshare/banwords.txt

    不过这种文件一般会把political的和spammer类的东西一起加进去
    一般网站做过滤应该是够用了.
    guangwong
        5
    guangwong  
       Oct 30, 2013
    工信部应该有下发才对
    ipconfiger
        6
    ipconfiger  
       Oct 30, 2013
    中华语言博大精深......
    faceair
        7
    faceair  
       Oct 30, 2013   ❤️ 1
    网络发言防和谐器 http://fanghexie.sinaapp.com/

    提供的软件版里面有份(下载:http://fanhexie.googlecode.com/files/fanghexieqi.rar)
    压缩包bin目录下minganci.txt里面有一些

    不过作者好像很久没更新了 可以尝试联系作者微博(http://t.qq.com/yangwei0577)看看
    skyangel3
        8
    skyangel3  
       Oct 31, 2013   ❤️ 1
    靠谱的脏话词库? 应该是你认为属于脏话的, 找一个差不多的, 然后慢慢添加修改, 想一步到位是不可能的。
    pepsin
        9
    pepsin  
       Oct 31, 2013   ❤️ 1
    楼主给了我一个好思路去下载来学习语言博大精深之处。。。
    wickila
        10
    wickila  
       Oct 31, 2013   ❤️ 1
    我把我们游戏里面的脏话字符发了一份给你.看能不能用得上
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1311 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 17:15 · PVG 01:15 · LAX 10:15 · JFK 13:15
    ♥ Do have faith in what you're doing.