在python中如何分句?这些代码你非常需要

本篇文章小编给大家详细介绍一下我们在python中,如何进行分句的方法,感兴趣的小伙伴可以仔细阅读一下这篇文章,小编相信大家通过阅读之后一定能够收获颇多!

在python中如何分句?这些代码你非常需要

文章插图
我们在python中,进行分句的关键是我们需要找到在代码中合适的结束符号,就像作文中中文里的句号和逗号,英文里面的点,而且在这点上大家也都知道中英是有很大的区别的 。
那小编就直接在这里给大家介绍一种纯用Python代码来给大家实现分句函数 。
def cut_sentences(content):         # 结束符号,包含中文和英文的         end_flag = ['?', '!', '.', '?', '!', ' 。', '…']                  content_len = len(content)         sentences = []         tmp_char = ''         for idx, char in enumerate(content):                # 拼接字符                tmp_char += char                 # 判断是否已经到了**后一位                if (idx + 1) == content_len:                        sentences.append(tmp_char)                        break                                        # 判断此字符是否为结束符号                if char in end_flag:                        # 再判断下一个字符是否为结束符号,如果不是结束符号,则切分句子                        next_idx = idx + 1                        if not content[next_idx] in end_flag:                                sentences.append(tmp_char)                                tmp_char = ''                                         return sentences  content = '在处理文本时,会遇到需要将文本以 句子 为单位进行切分(分句)的场景,而文本又可以分为 中文文本 和 英文文本  ,处理的方法会略有不同 。本文会介绍 Python 是如何处理 分句 的 。' sentences = cut_sentences(content) print('  '.join(sentences))  在处理文本时,会遇到需要将文本以 句子 为单位进行切分(分句)的场景,而文本又可以分为 中文文本 和 英文文本 , 处理的方法会略有不同 。  本文会介绍 Python 是如何处理 分句 的 。

推荐阅读