Counter
V2EX  ›  问与答

Python 是最适合用来做爬虫和模拟登录的语言吗?

  •  
  •   Counter · May 13, 2019 · 2847 views
    This topic created in 2559 days ago, the information mentioned may be changed or developed.

    对于这两个方面,只讨论开发效率的话

    10 replies    2019-05-13 20:02:57 +08:00
    Arnie97
        1
    Arnie97  
       May 13, 2019 via Android
    只考虑开发效率的话,应该是 JS + headless Chrome,自己模拟浏览器肯定不会比直接用真的浏览器更方便
    locoz
        2
    locoz  
       May 13, 2019   ❤️ 1
    只讨论开发效率的话,通常来说是的,因为现有的库很多很完善了,各种加解密、字节操作都能随意地搞,实在不行再调用其他语言搞就好了。
    murmur
        3
    murmur  
       May 13, 2019
    现在的爬虫在语言已经没优势了,拼的是反扒,反扒这块就跟 python 没关了
    102400
        4
    102400  
       May 13, 2019
    不是
    Counter
        5
    Counter  
    OP
       May 13, 2019
    @102400 愿闻其详
    mooncakejs
        6
    mooncakejs  
       May 13, 2019
    nodejs 出来之前是,nodejs 成熟后,最适合的是 js
    q8164305
        7
    q8164305  
       May 13, 2019 via Android
    我觉得是 js
    102400
        8
    102400  
       May 13, 2019   ❤️ 1
    @Counter Python 所谓的爬虫框架和各种爬虫入门教程,确实容易让人觉得是写爬虫的不二之选,然而用其它语言来做对比并不见得有优势,唯一的优点就是教程和库多,复杂验证惨景的爬虫或者说模拟登陆 python 并没有优势,说句大实话,甚至不如易语言
    Orciorc
        9
    Orciorc  
       May 13, 2019 via Android
    就模拟登录和信息获取这一块,curl 和 python 的 request 深得我心,java 的 okhtttp 正在尝试
    superalsrk
        10
    superalsrk  
       May 13, 2019
    手动狗头。。其实这俩需求, 使用最广的技术栈其实是易语言
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2555 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 16:06 · PVG 00:06 · LAX 09:06 · JFK 12:06
    ♥ Do have faith in what you're doing.