• 请不要在回答技术问题时复制粘贴 AI 生成的内容
SlipStupig
V2EX  ›  程序员

自己写的爬虫如何测速抓取速度呢?

  •  
  •   SlipStupig · Sep 3, 2017 · 5048 views
    This topic created in 3177 days ago, the information mentioned may be changed or developed.
    我自己做了一个分布式爬虫,但是我想知道我到底能到什么速度,有没什么办法可以离线测试抓取速度呢,比如:一秒钟可以下载完成多少个网页,不需要太精确,有个大概就行?
    10 replies    2017-09-03 20:56:21 +08:00
    t6attack
        1
    t6attack  
       Sep 3, 2017
    网络环境是影响速度的重要因素。离线了还咋测试速度
    linuxchild
        2
    linuxchild  
       Sep 3, 2017 via iPhone
    监控网络速度吧,然后取均值
    huangfs
        3
    huangfs  
       Sep 3, 2017
    日志能估算吧。
    bazingaterry
        4
    bazingaterry  
       Sep 3, 2017 via iPhone
    自己写的爬虫,里面写一下统计有难度吗……
    SlipStupig
        5
    SlipStupig  
    OP
       Sep 3, 2017
    @bazingaterry 速度这块真不好算,我需要一个一些性能指标的基线数据,现在不知道怎么弄

    @t6attack
    ericls
        6
    ericls  
       Sep 3, 2017 via iPhone
    既然是分布式 还是测试 scalability 吧
    bazingaterry
        7
    bazingaterry  
       Sep 3, 2017 via iPhone
    @SlipStupig 看你需要的精度?大不了一个页面一行 log。
    Devmingwang
        8
    Devmingwang  
       Sep 3, 2017
    爬吧,豆瓣网子域名,read01 等等等一大批网站都已经疯掉国外部分 IDC 访问了。。。。
    nywwsba
        9
    nywwsba  
       Sep 3, 2017
    楼主现在用什么来跑爬虫呢? vultr 怎么样
    jalena
        10
    jalena  
       Sep 3, 2017
    在执行前和执行结束写个时间,算一下不就好了么?多测试几次取个平均值就好了嘛
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2831 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 43ms · UTC 10:52 · PVG 18:52 · LAX 03:52 · JFK 06:52
    ♥ Do have faith in what you're doing.