美林数据
ABOUT US
美林数据技术股份有限公司(简称:美林数据,NEEQ:831546)是国内知名的数据治理和数据分析服务提供商。

如何从 “用户评论”中挖掘业务价值

2019-06-21 11:26:18
2019年电商依然是消费增长的主力军。今年前5个月,我国网上零售额总额达到3.86万亿元,在社会消费品零售总额中占比超过1/5。刚刚过去的618购物节,各个电商又再次刷新了自己的平台销售记录。电子商务成为我们消费者选购商品的主要平台,而购买后填写评价也是很多人的习惯,这些评价可能是分享喜悦夸奖物有所值的,也可能是是吐槽不满的。这些或长或短的文字,包含了用户对于产品或者服务的认可与接受度。
产品或者服务的提供商或者销售商,如何通过这一条条的评论来解读用户想法,作为后续产品与服务改进或者营销策略优化的重要参考依据。针对这些非结构化的用户评论的分析与解读,我们需要借用“文本分析”的方法来完成。
文本分析的本质是从给定文本中获取高质量、有用信息的自动化过程,其一般步骤为:数据采集、数据清洗、文本挖掘分析、可视化分析。
 文本挖掘
评论数据一般为消费者对特定商品的评价或是社会大众对新闻事件的评论,信息通常分布在网页中,一般采取爬虫的方式获取数据。评论数据多为非正式的书面评论,存在诸多非法字符比如表情、符号等,往往需要通过数据清洗完成数据的规整。清洗后的数据可以基于自然语言处理相关技术(词法分析、句法分析、信息抽取、主旨话题模型)进行分析;文本分析结果可进一步结合数据的元信息做场景化的可视化面板展示。
评论数据作为用户问题、建议、态度的载体,对产品评估和改进优化极具价值。对于用户评论数据,我们可以通过文本分析解读用户的关注焦点、主要讨论话题、用户的情感倾向,以及主要评论的主体对象等。小T以某电商手机的用户评论为例,通过对用户评论的进行分析,获取客户对于手机相关评价,为手机设计优化提供参考和依据。
 评论分析

评论焦点分析-获取评论关键词

评论焦点分析通过关键词抽取技术实现关键词获取,并通过统计关键词的词频大小获取评论焦点的热度,具体挖掘流程如下所示。首先基于词法分析做评论的分词和词条的词性标注,文本过滤筛选符合关键词搜索域的词条,比如,名词、动词、形容词等,接着基于关键词抽取技术抽取关键词,最后,对关键词做词频统计并基于词云图展示评论热点评论焦点。
 文本挖掘-获取评论数据
经过上述挖掘流程完成评论焦点抽取,如下是关键词抽取的结果示例:

评论数据

统计关键词词频并基于词云图进行展现,以手机评论为分析场景,则可以看到:评论的焦点集中在手机电池是否耐用、手机外观、系统流畅性、手机拍照清晰度等方面。
 用户评论词云图
评论话题分析-获取评论主题

每一条评论都围绕一个或几个核心主旨进行阐述,这个核心主旨就是评论的中心思想。基于主旨话题分析技术获取文本主旨,每一条评论可能包含多个主旨话题,每一个话题包含多个主题词,通过评论的隶属度确定评论所属的主旨话题,通过主题词的分布确定主旨的含义。评论话题的具体分析流程如下,此过程要依次进行词法分析、文本过滤、主旨话题分析:
 用户评论文本数据
基于评论文本构建主旨话题分析模型,模型结构如下所示。根据每个话题下的主题词的分布可以确定主题的含义,比如:外观、电池等,分别给每个主题注明主题含义。

评论文本数据

完成上述主题模型编辑后,基于主题模型对评论文本打标签,即给出每条评论文本的话题。
文本分析

评论情感分析-获取用户情感倾向

评论文本中往往带着评论者的主观情感色彩,这些积极、中性或消极的评价表达了评价者对产品品牌的态度倾向。基于情感分析模型,能够分析出评论中的情感色彩;具体的挖掘流程如下,依次进行词法分析、文本过滤、情感分析。
评论数据情感分析 
情感分析完成每一条文本的情感预测,得出用户评论内容是积极、消极还是中性:

情感分析

评论观点抽取-获取评论观点

评论文本往往会在不同的关注点上表达评论者对某一要素的看法,即评论者秉持的观点。观点由评价对象和评价构成,以“手机外观漂亮”为例,则评价对象是外观,评价是漂亮,评论观点往往代表着评论者的关注焦点及其情感。基于句法分析结合观点规则实现对评论文本的观点抽取,此过程对评论依次进行词法分析、句法分析、观点抽取。
 评论观点抽取
在抽取观点过程中,可以指定评价对象,进而有针对性的抽取指定对象的评论观点;比如:抽取拍照、外观、电池、系统、性价比等评论对象的观点,抽取出的观点如下所示:

文本分析

基于评论观点做词频统计,进而发现热点评论:
 给予TempoBI的评论数据词云图

评价对象抽取-获取评论对象

面对一系列的评论数据,每一条评论关注点不尽相同,比如:针对手机的评论,有些人关注外观、有些人关注性价比、有些人关注拍照等,基于信息抽取技术可以实现对评论对象的抽取,抽取结果如下所示:


用户评论数据

基于文本挖掘分析可以获取诸多信息,将挖掘获取信息和数据的元信息相结合做可视化分析,更能够直观分析用户评论隐藏的规律。以下是小T列举了“可视化分析+挖掘分析”的示例,基于不同的分析维度可以窥探到更多的市场讯息。
将年龄与评论话题相结合:基于评论话题分析结果结合评论者年龄分布做可视化分析,分析不同年龄段用户对手机关注维度的区别:
 文本分析可视结果

将品牌与情感分析相结合:基于情感分析结果结合各手机品牌信息可分析不同品牌的市场欢迎度(小T特别强调:仅为分析示例,不代表真实情况哦):
 文本挖掘结果可视化

通过以上分析,我们将原本难以解读的非结构化文本数据转化为“结构化数据”,借用可视化方法更直观地解读用户评价。为手机制造商与销售平台提供业务决策参考依据。
基于文本分析的“用户评价”解读,已经广泛应用于多个行业和领域,零售、金融、旅游、政务……只要能够获取到评论内容的载体平台,都可以通过对评论文本的解读,来实现自身产品与服务的优化、营销与竞争策略调整、精细化管理等。
而要实现用户评价分析,如果您的数据量不是很大,熟悉机器学习算法如R语言或Python等,可以采用编码的方式实现。如果您的数据量较大,分析完成后还需要与业务应用系统相融合,那么小T给您安利一款简单好用的AI建模工具,不需要复杂编码,简单拖拽就可以实现以上分析。来张图感受一下:
 TempoAI文本挖掘流程

这款工具就是美林数据自主研发的Tempo大数据分析平台,是一款集数据接入、数据处理、数据挖掘、数据可视化、数据应用于一体的软件产品。它秉持“智能、互动、增值”的设计理念,面向企业级用户提供自助式数据探索与分析能力,为企业提供从BI到AI的一体化数据分析与应用解决方案。
不仅可以进行文本数据分析,还支持上百种机器学习算法,可以满足多种业务分析与建模需求。是一款安全自主可控的优秀国产数据分析与应用软件!


服务热线
400-608-2558
咨询热线
029-88696198
美林数据
微信扫描二维码,立即在线咨询