温馨提示×

R语言怎么进行情感分析和词频统计

小亿
88
2024-03-04 09:51:26
栏目: 编程语言

在R语言中进行情感分析和词频统计通常需要使用一些额外的包,例如tm和sentimentr。以下是一个简单的示例代码,可以进行情感分析和词频统计:

# 安装和加载必要的包
install.packages("tm")
install.packages("sentimentr")
library(tm)
library(sentimentr)

# 创建一个文本向量
text <- c("这个电影非常好看,情节紵紵有致,演员表现也很出色。",
          "这个餐厅的服务太差了,食物也不好吃。")

# 创建一个语料库
corpus <- VCorpus(VectorSource(text))

# 进行文本预处理
corpus <- tm_map(corpus, content_transformer(tolower))
corpus <- tm_map(corpus, removePunctuation)
corpus <- tm_map(corpus, removeNumbers)
corpus <- tm_map(corpus, removeWords, stopwords("en"))

# 进行情感分析
sentiment <- sentiment(corpus)

# 输出情感分析结果
print(sentiment$all)

# 进行词频统计
tdm <- TermDocumentMatrix(corpus)
freq <- rowSums(as.matrix(tdm))
freq <- subset(freq, freq > 0)
freq <- sort(freq, decreasing = TRUE)

# 输出词频统计结果
print(freq)

这段代码首先创建了一个包含两个文本的向量,然后将其转换为语料库并进行文本预处理。接下来使用sentimentr包进行情感分析,并输出结果。最后使用tm包中的TermDocumentMatrix函数进行词频统计,并输出结果。

使用这段代码可以很方便地进行情感分析和词频统计,可以根据实际需求对代码进行进一步的修改和扩展。

0