在使用python爬虫去抓取数据的时候一般都是将这个网站的HTML结构和数据都抓取回来再进行数据的处理,但是有些小伙伴发现在打印html的时候没有乱码,保存在文件里就出现乱码了 。那么下面这一篇文章就来讲一个办法来解决html乱码的问题,一起看看吧 。
文章插图
在python之中直接将html代码输出到控制台的时候没有出现乱码的原因是当前的python程序已经设置了编码格式为中文的utf-8,但是在保存为文件的时候也需要去设置为中文编码格式,否则当html数据中有中文的时候就会出现乱码的情况 。
【Python中html乱码怎么办?一招教你轻松解决】在使用open()方法去打开或创建一个文本文档文件并写入数据的时候可以需要设置一下encoding参数的值为utf-8,这样这个文件就变成中文编码字符集了 。同时也要使用with语法来在这个文件写入数据完毕时自动的关闭文件并释放资源,示例如下:
from urllib import request url = "http://www.renren.com/967487029/profile" rsp = request.urlopen(url)html = rsp.read().decode()# 设置中文编码字符集 with open("rsp.html","w",encoding="utf-8")as f: print(html) f.write(html)以上就是关于“Python中html乱码怎么办?一招教你轻松解决”的全部内容了,想要了解更多python的实用知识和代码示例可以持续关注这个频道,每次更新都会有很多新的知识技术分享给大家 。
推荐阅读
- 什么是热数据和冷数据?通过python大数据的角度来给你讲解
- Python可以做桌面应用程序吗?点进来了解一下这几个GUI平台
- 如何用python的wx模块来创建文本编辑器?这三部曲你要会
- Django中的ORM删和改怎么用?这篇文章教会你
- python保存程序后怎么运行?这篇文章值得一看
- python列表如何去重?这四个方法你不一定知道
- python如何面向对象编程?这篇文章讲解的非常透彻
- python删除list中的重复元素?运用append方法轻松实现
- 简单python项目类型有哪些?这篇文章分享俩个经典又简单的项目
- 抖音中视频伙伴计划什么时候结束?相关问题解答