我在用 urllib.request 抓取网页时用了 try.....except Exception as e: ,让他出错就在屏幕显示出来,然后再继续下一个循环。
可是现在碰到一个问题,就是有些页面不能连接后会转到 404 页面,但是这时就不会触发 except ,导致 urllib.request 会取到 404 页面的代码,后边的程序再分析这个 404 页面,当然分析不出来结果。
像这样的情况应该如何解决?
可是现在碰到一个问题,就是有些页面不能连接后会转到 404 页面,但是这时就不会触发 except ,导致 urllib.request 会取到 404 页面的代码,后边的程序再分析这个 404 页面,当然分析不出来结果。
像这样的情况应该如何解决?