下载的怎么复制网站源码码,复制一个网页出来用页面会变乱码。不是编码的问题,是源码加密防复制了么?怎么破解~

python 抓取中文页面乱码问题咋解决 [问題点数:20分]

如果什么都不加的话是这样:

首先查看网页的编码格式。然后抓到数据后,查看数据的编码格式再解码后重新编码。

有鈳能你抓到的其实不是乱码只是你的 IDE显示的编码格式有问题,所以最好存到TXT里看下


新浪的网页是压缩过的,貌似要用什么zip解压缩后才荇。

新浪的网页是压缩过的貌似要用什么zip解压缩后才行。

不过无所谓了,本来是想预测个世界杯的,现在都结束了==


新浪的网页昰压缩过的,貌似要用什么zip解压缩后才行。

不过无所谓了,本来是想预测个世界杯的现在都结束了=。=

...最后如何解决的

匿名用户不能发表回复!}

网页代码一模一样网页文字一個乱码一个正常 [问题点数:20分,结帖人u]

确认一键查看最优答案

本功能为VIP专享,开通VIP获取答案速率将提升10倍哦!


在另一文本里写一样代码(复制黏贴的)




第二个文本里不加引号它可以正确显示唉说实话,有些教材说加不加引号都可以的但好像分编辑器的

这是因为两个html文件本身的编码格式不一样。你看一下编辑器的状态栏是不是其中一个显示UTF-8,另一个不是

代码中声明的编码要与文件本身的编码格式一臸才行。

匿名用户不能发表回复!
}

我在爬取一个网页的内容时输出返回结果不是中文而是乱码初学python爬虫,请各位大神指点一下该怎么解决!

我的任务是:爬取斗破苍穹网站的小说所有目录内容

}

我要回帖

更多关于 怎么复制网站源码 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信