from snownlp import SnowNLP # 引入SnowNLP库,用于中文情感分析 import csv # 用于处理CSV文件的读写操作 import os # 用于操作系统相关功能 import sys import os # 获取当前文件的绝对路径 current_file_path = os.path.abspath(__file__) # 获取当前文件的父目录路径 parent_dir = os.path.dirname(current_file_path) # 获取父目录的父目录路径,也就是项目根目录 project_root_dir = os.path.dirname(parent_dir) # 将项目根目录添加到 Python 路径中 sys.path.append(project_root_dir) # 现在可以导入 utils 目录中的模块了 from utils.getPublicData import getAllCommentsData # 自定义函数,用于获取评论数据 def targetFile(): targetFile = 'target.csv' # 定义目标文件名称 commentsList = getAllCommentsData() # 获取所有评论数据 rateData = [] # 用于存储处理后的评论数据 good = 0 # 记录正面评论数量 bad = 0 # 记录负面评论数量 middle = 0 # 记录中性评论数量 # 遍历所有评论,进行情感分析 for index, i in enumerate(commentsList): # enumerate 是 Python 中的一个内置函数,它允许我们在遍历可迭代对象(如列表、元组或字符串)时同时获取元素的索引和值。 # |articleId|created_at | likes_counts | region | content| authorName | authorGender | authorAddress | authorAvatar value = SnowNLP(i[4]).sentiments # 对评论内容进行情感分析 if value > 0.5: # 如果情感值大于0.5,判定为正面评论 good += 1 rateData.append([i[4], '正面']) elif value == 0.5: # 如果情感值等于0.5,判定为中性评论 middle += 1 rateData.append([i[4], '中性']) elif value < 0.5: # 如果情感值小于0.5,判定为负面评论 bad += 1 rateData.append([i[4], '负面']) # 将处理后的评论数据写入目标文件 for i in rateData: with open(targetFile, 'a+', encoding='utf8', newline='') as f: writer = csv.writer(f) writer.writerow(i) # 将每条数据写入CSV文件 def main(): targetFile() # 调用targetFile函数进行数据处理 if __name__ == '__main__': main() # 运行主函数