某个网站会对浏览器 navigator 的 webdriver 字段进行检测
写了一段 js 来修改 webdriver 的值,如下
Object.defineProperty(window.navigator, 'webdriver', {configurable:true});
现在的问题是,这段 js 在 pyppeteer 中可以过检测,但是在 selenium 中不可以。
经过测试大概有以下几种 case
-
pyppeteer 中不注入 js,不过检测
-
pyppeteer 中注入 js,过检测
-
selenium 中注入 js 不过检测,但是控制台查看 webdriver 字段已被修改
-
在 selenium 中不刷新网页,控制台重新输入上述 js,不过检测
-
在 selenium 中刷新网页(手动),在控制台输入上述 js,过检测
pyppeteer 代码如下
async def main():
launch_kwargs = {
"headless": False,
}
browser = await launch(launch_kwargs)
page = await browser.newPage() #
await page.goto("https://www.xxxx.com")
await page.evaluate(pageFunction="""
Object.defineProperty(window.navigator, 'webdriver', {configurable:true});
""", force_expr=True)
while True:
time.sleep(1)
selenium 代码如下
url = "https://www.xxxx.com"
driver = webdriver.Chrome()
driver.get(url)
driver.execute_script(js) #driver.execute_async_script(js)(也不行)
while True:
time.sleep(1)
按理说,通过 case1、case2、case5 应该可以确定 webdrier 是过不过检测的关键字段,那么如果
- 网页加载完毕后,网页就已经完成了对 webdriver 字段的检测,那么 case 2、case 5 应该不过检测才对
- 如果网页是每次执行相关组件才去检测 webdriver 字段,那么 case3、case4 应该过检测才对
pyppeteer 和 selenium 这俩在注入 js 的时候有什么不一样的地方吗?
还有最让我迷惑的是 case4 和 case5 为什么结果不一样啊?