Python实现爬取并分析电商评论

时间:2021-05-23

  现如今各种APP、微信订阅号、微博、购物网站等网站都允许用户发表一些个人看法、意见、态度、评价、立场等信息。针对这些数据,我们可以利用情感分析技术对其进行分析,总结出大量的有价值信息。例如对商品评论的分析,可以了解用户对商品的满意度,进而改进产品;通过对一个人分布内容的分析,了解他的情绪变化,哪种情绪多,哪种情绪少,进而分析他的性格。怎样知道哪些评论是正面的,哪些评论是负面的呢?正面评价的概率是多少呢?

  利用python的第三方模块SnowNLP可以实现对评论内容的情感分析预测,SnowNLP可以方便的处理中文文本内容,如中文分词、词性标注、情感分析、文本分类、提取文本关键词、文本相似度计算等。大概大于等于0.5,可以判断为正面评价——积极情感,小于0.5,可以判断为负面评价——消极情感。

  下面分析一组京东上某产品的评论数据并生成折线图:

部分源数据:

实现过程:

#加载情感分析模块from snownlp import SnowNLP#from snownlp import sentimentimport pandas as pdimport matplotlib.pyplot as plt#导入样例数据aa ='F:\\python入门\\python编程锦囊\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\09\\data\\京东评论.xls'#读取文本数据df=pd.read_excel(aa)#提取所有数据df1=df.iloc[:,3]print('将提取的数据打印出来:\n',df1)#遍历每条评论进行预测values=[SnowNLP(i).sentiments for i in df1]#输出积极的概率,大于0.5积极的,小于0.5消极的#myval保存预测值myval=[]good=0bad=0for i in values: if (i>=0.5): myval.append("正面") good=good+1 else: myval.append("负面") bad=bad+1df['预测值']=valuesdf['评价类别']=myval#将结果输出到Exceldf.to_excel('F:\\python入门\\python编程锦囊\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\Code(实例源码及使用说明)\\09\\data\\result2.xls')rate=good/(good+bad)print('好评率','%.f%%' % (rate * 100)) #格式化为百分比#作图y=valuesplt.rc('font', family='SimHei', size=10)plt.plot(y, marker='o', mec='r', mfc='w',label=u'评价分值')plt.xlabel('用户')plt.ylabel('评价分值')# 让图例生效plt.legend()#添加标题plt.title('京东评论情感分析',family='SimHei',size=14,color='blue')plt.show()

Excel结果:

作图的结果:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。

声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

相关文章