温馨提示×

​python中jieba库函数怎么使用

小亿
113
2023-10-12 19:47:25
栏目: 编程语言

jieba库是一个用于中文分词的工具库。下面是一些常见的jieba库函数用法示例:

  1. 分词
import jieba
# 全模式分词
text = "我爱自然语言处理"
result = jieba.cut(text, cut_all=True)
print("/".join(result))  # 输出:我/爱/自然/自然语言/语言/处理
# 精确模式分词
result = jieba.cut(text, cut_all=False)
print("/".join(result))  # 输出:我/爱/自然语言处理
# 默认模式分词(精确模式的别名)
result = jieba.cut(text)
print("/".join(result))  # 输出:我/爱/自然语言处理
# 搜索引擎模式分词
result = jieba.cut_for_search(text)
print("/".join(result))  # 输出:我/爱/自然/语言/处理
  1. 添加自定义词典
import jieba
text = "我是自然语言处理工程师"
result = jieba.cut(text)
print("/".join(result))  # 输出:我/是/自然/语言/处理/工程师
# 添加自定义词典
jieba.add_word("自然语言处理")
result = jieba.cut(text)
print("/".join(result))  # 输出:我/是/自然语言处理/工程师
# 添加自定义词典(指定词频)
jieba.add_word("自然语言处理", freq=100)
result = jieba.cut(text)
print("/".join(result))  # 输出:我/是/自然语言处理/工程师
  1. 关键词提取
import jieba.analyse
text = "我是一名自然语言处理工程师,对文本处理很感兴趣。"
keywords = jieba.analyse.extract_tags(text, topK=3)
print(keywords)  # 输出:['自然语言处理', '文本处理', '感兴趣']

以上是jieba库的一些常见用法,更多详细的函数用法可以参考jieba官方文档。

0