我们可以在分词的时候添加停用词,就像下面这样
因为中文分词需要自己手动分开,那么我们如何自动分词呢?可以用结巴分词
示例代码:
def cut_word(text):
"""
进行中文分词:"我爱北京天安门" -->
2020-07-21