如果什么都不加的话是这样:
首先查看网页的编码格式。然后抓到数据后,查看数据的编码格式再解码后重新编码。
有鈳能你抓到的其实不是乱码只是你的 IDE显示的编码格式有问题,所以最好存到TXT里看下
新浪的网页是压缩过的,貌似要用什么zip解压缩后才荇。
不过无所谓了,本来是想预测个世界杯的,现在都结束了==
...最后如何解决的
确认一键查看最优答案
本功能为VIP专享,开通VIP获取答案速率将提升10倍哦!
在另一文本里写一样代码(复制黏贴的)
第二个文本里不加引号它可以正确显示唉说实话,有些教材说加不加引号都可以的但好像分编辑器的
这是因为两个html文件本身的编码格式不一样。你看一下编辑器的状态栏是不是其中一个显示UTF-8,另一个不是代码中声明的编码要与文件本身的编码格式一臸才行。
我在爬取一个网页的内容时输出返回结果不是中文而是乱码初学python爬虫,请各位大神指点一下该怎么解决!
我的任务是:爬取斗破苍穹网站的小说所有目录内容
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。