python程序开发之中经常需要去做的一个事情就是数据处理 , 而数据处理中对字符串这种类型的操作可以说是最频繁的了 。而下面这一篇文章会来详细讲解一下 , 该怎么使用flashtext这个工具完成数据清洗操作 , 感兴趣的小伙伴可以一起往下看看 。
文章插图
一、安装工具
flashtext虽然说是一个工具 , 但是它是可以作为模块来导入使用 , 并且用pip命令就能下载安装好 。使用win+r快捷方式打开运行窗口 , 然后输入cmd并回车即可以管理员身份打开命令提示符 , 接着使用国内清华镜像源安装该工具 , 示例如下:
pip install flashtext -i https://pypi.tuna.tsinghua.edu.cn/simple二、使用flashtext工具
那么使用它来玩数据清洗操作实际上就分为两步 , 第一步是将需要清洗的数据 , 也就是关键词添加到处理器词库之中 , 代码示例如下所示:
from flashtext import KeywordProcessorprocessor = KeywordProcessor()processor.add_keyword('Python')添加完成之后该词库之中就是已经保存了该关键词 , 接下来所有的操作都是围绕这个关键词来完成 , 因为字符串类型对象数据清洗就是取出其中的关键词以及替换关键词两种方式 。
那么提取关键词的方法也很简单 , 只需要使用这个对象去调用extract方法并且传入字符串类型对象作为参数 , 就可以把该对象中所有的关键词取出来 , 示例如下所示:
found = processor.extract_keywords('I like Python and Scala.')print(found)另外一种方法就是在字符串对象中匹配到词库内所有的关键词 , 然后使用别名来替换该关键词 。需要在添加关键词时写上两个参数 , 代码如下所示:
processor.add_keyword('Scala', 'Java')replaced = processor.replace_keywords('I like Scala.')【Python怎么使用flashtext数据清洗工具?Python如何使用flashtext替换字符】以上就是关于“Python怎么使用flashtext数据清洗工具?Python如何使用flashtext替换字符”的全部内容了 , 希望对你有所帮助 。
推荐阅读
- Python如何操作RabbitMQ?Python怎么去使用消息队列完成通信
- 蓝牙耳机怎么戴上耳朵不会掉
- 我有一个想法作文300字三年级上册 怎么写我有一个想法作文呢
- 小学横截面怎么理解 小学横截面如何理解
- 端午节用英文怎么说 端午节用英文如何说
- 智慧普华车贷扣款日早上没有扣够车贷,是不是中午还会再扣,不扣情况下,怎么去还??
- 温柿子怎么温 温柿子的办法
- 微信服务号怎么用微喵软件?
- 坐飞机化妆品怎么带 坐飞机化妆品如何带
- 大暑天怎么坐月子 大暑天如何坐月子