本篇文章小编给大家详细介绍一下我们在python中,如何进行分句的方法,感兴趣的小伙伴可以仔细阅读一下这篇文章,小编相信大家通过阅读之后一定能够收获颇多!
文章插图
我们在python中,进行分句的关键是我们需要找到在代码中合适的结束符号,就像作文中中文里的句号和逗号,英文里面的点,而且在这点上大家也都知道中英是有很大的区别的 。
那小编就直接在这里给大家介绍一种纯用Python代码来给大家实现分句函数 。
def cut_sentences(content): # 结束符号,包含中文和英文的 end_flag = ['?', '!', '.', '?', '!', ' 。', '…'] content_len = len(content) sentences = [] tmp_char = '' for idx, char in enumerate(content): # 拼接字符 tmp_char += char # 判断是否已经到了**后一位 if (idx + 1) == content_len: sentences.append(tmp_char) break # 判断此字符是否为结束符号 if char in end_flag: # 再判断下一个字符是否为结束符号,如果不是结束符号,则切分句子 next_idx = idx + 1 if not content[next_idx] in end_flag: sentences.append(tmp_char) tmp_char = '' return sentences content = '在处理文本时,会遇到需要将文本以 句子 为单位进行切分(分句)的场景,而文本又可以分为 中文文本 和 英文文本 ,处理的方法会略有不同 。本文会介绍 Python 是如何处理 分句 的 。' sentences = cut_sentences(content) print(' '.join(sentences)) 在处理文本时,会遇到需要将文本以 句子 为单位进行切分(分句)的场景,而文本又可以分为 中文文本 和 英文文本 , 处理的方法会略有不同 。 本文会介绍 Python 是如何处理 分句 的 。
推荐阅读
- python脚本文件的扩展名是什么?这篇文章值得一看
- python如何检验安装成功?这两个方法你可能用得上
- python怎么模拟键盘操作?这篇文章你值得一看
- python怎么写延时?这个方法非常有用
- python几个数如何比大小?通过这俩个知识点非常简单
- mongodb在命令中怎么启动不了?这个方法你一定用得上
- python的注释符是什么?这篇文章值得你阅读
- python中的strip是什么意思?这篇文章告诉你什么是strip
- python列表和字典区别?这篇文章值得我们阅读
- 如何查看python内置函数源码?这篇文章非常推荐你阅读