• 请不要在回答技术问题时复制粘贴 AI 生成的内容
BeanYoung
V2EX  ›  程序员

应对无下限无节操爬虫,是不是可以尝试sql注入?或是有更好的方法?

  •  
  •   BeanYoung · Dec 14, 2013 · 6693 views
    This topic created in 4546 days ago, the information mentioned may be changed or developed.
    最近发现一个ip(杭州某家信用卡app的服务器,对就是某1信用卡管家)以每秒200次的频率爬取我们的数据,虽然禁掉ip还是不能让其停止,联系对方工作人员依然无果。

    刚才去掉了ip限制,然后对该ip的请求返回假数据,貌似对方的爬虫脚本被搞挂掉了。

    突然想起来,对付这样的爬虫,是不是可以尝试一下sql注入,大家有没有类似的对付爬虫的经验?
    Supplement 1  ·  Dec 14, 2013
    昨天尝试了通过ip访问频率来限制 想到某些移动浏览器的访问会用他们自己的服务器做代理 大量请求都来自同一批ip 在没有ip白名单的情况下也不好做自动ip限制
    20 replies    1970-01-01 08:00:00 +08:00
    liuxurong
        1
    liuxurong  
       Dec 14, 2013   ❤️ 3
    好玩点的话 针对那个IP给他返回垃圾信息 让他采美女图片去 XDDD..
    Flyfish
        2
    Flyfish  
       Dec 14, 2013 via Android
    楼上好邪恶啊,哈哈哈
    vibbow
        3
    vibbow  
       Dec 14, 2013   ❤️ 1
    之前被某H****z空间商恶意采集(攻击)过。
    我的做法是301跳转到Ubuntu镜像去...
    kendisk
        4
    kendisk  
       Dec 14, 2013
    @vibbow 应该跳转到ccav
    ufo22940268
        5
    ufo22940268  
       Dec 14, 2013 via iPhone
    笑尿,好想知道lz在哪家公司的
    humiaozuzu
        6
    humiaozuzu  
       Dec 14, 2013
    话说有什么工具可以发现有人在扒你数据。有什么工具可以定制策略吗?
    jason52
        7
    jason52  
       Dec 14, 2013
    思路不错哟!!!
    bombless
        8
    bombless  
       Dec 14, 2013
    你应对的是一个移动的目标……
    如果对方的确暴露出一些特征,当然可以对应的去攻击……
    比如对方用了一个很脆弱的HTTP解析库,遇到非预期的HTTP响应就崩溃,那……
    subpo
        9
    subpo  
       Dec 14, 2013
    带上他们公司的信息301到政府网站,不日,对方公司网站被墙。
    34D
        10
    34D  
       Dec 14, 2013
    @ufo22940268 目测是51信用卡,我同事之前在这公司帮他们写正则表达式,他说千万不要用他们的东西,你邮件内容他们都可以看到的。
    shiny
        11
    shiny  
    PRO
       Dec 14, 2013
    iptables block 之就差不多了。
    lovedboy
        12
    lovedboy  
       Dec 14, 2013   ❤️ 1
    可以在返回的信息中插入sql代码。
    subpo
        13
    subpo  
       Dec 14, 2013
    @34D 都是这么查账单的
    BeanYoung
        14
    BeanYoung  
    OP
       Dec 14, 2013 via iPhone
    @humiaozuzu 通过nginx日志可以发现ip访问记录 找出异常的ip
    BeanYoung
        15
    BeanYoung  
    OP
       Dec 14, 2013 via iPhone
    @liuxurong
    @vibbow
    @subpo 是个post请求 原本想301到他们自己的网站 找了半天 没在他们网站发现可以post的地址
    loveshouhu
        16
    loveshouhu  
       Dec 14, 2013
    @subpo 好邪恶啊。我喜欢 XD
    humiaozuzu
        17
    humiaozuzu  
       Dec 14, 2013   ❤️ 1
    @BeanYoung 301 没法重定向 post 的,需要307,https://gist.github.com/humiaozuzu/7333277
    forgottencoast
        18
    forgottencoast  
       Dec 14, 2013
    找一个大文件,然后重定向到大文件,最好是大的HTML文件,非常复杂的DOM。
    无论他用DOM分析还是正则表达式,都有可能挂掉。哈哈。
    wwek
        19
    wwek  
       Dec 14, 2013
    大家很淫荡的说·
    zhonghua
        20
    zhonghua  
       Dec 14, 2013
    好欢乐
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3524 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 63ms · UTC 10:39 · PVG 18:39 · LAX 03:39 · JFK 06:39
    ♥ Do have faith in what you're doing.