我用这段代码来获取网站的头信息,用来判断网页的文字编码,
import urllib.request
f = urllib.request.urlopen('http://www.163.com')
print (f.info())
能够识别出网易的文字编码是 GBK ,显示:
Content-Type: text/html; charset=GBK
但是换成了中华网时在头信息里就没有了文字编码信息,这是怎么回事呢?
如果不用 urllib.request 的 info(),其他的还有什么方法能够获得网站的文字编码?
对了,我用的是 python3.4 ,我知道在 python2 中可以使用 chardet 库,但现在还没有 chardet 的 3 版本。
import urllib.request
f = urllib.request.urlopen('http://www.163.com')
print (f.info())
能够识别出网易的文字编码是 GBK ,显示:
Content-Type: text/html; charset=GBK
但是换成了中华网时在头信息里就没有了文字编码信息,这是怎么回事呢?
如果不用 urllib.request 的 info(),其他的还有什么方法能够获得网站的文字编码?
对了,我用的是 python3.4 ,我知道在 python2 中可以使用 chardet 库,但现在还没有 chardet 的 3 版本。