温馨提示×

python词频统计代码怎么写

小亿
112
2024-01-03 18:43:12
栏目: 编程语言

可以使用Python的Counter类来实现词频统计。以下是一个示例代码:

from collections import Counter

# 输入文本
text = "This is a sample text. It contains some words that will be counted."

# 将文本拆分成单词列表
words = text.split()

# 统计词频
word_freq = Counter(words)

# 打印词频结果
for word, freq in word_freq.items():
    print(f"{word}: {freq}")

运行以上代码,输出的结果将会是每个单词及其对应的词频。例如:

This: 1
is: 1
a: 1
sample: 1
text.: 1
It: 1
contains: 1
some: 1
words: 1
that: 1
will: 1
be: 1
counted.: 1

注意,这个示例代码没有进行任何文本处理(如词干提取、去除停用词等),仅仅是简单地按空格拆分文本并统计词频。如果需要更复杂的文本处理,可以使用正则表达式或其他库来实现。

0