今年的春节档可谓异常火爆,多不大片竞相角逐,成龙大哥、星爷也参与其中!最终却被第一部的国产科幻大片《流浪地球》抢了风头,成为领跑春节档票房的最大黑马,广受业界好评,更是成为第一部收藏到中国科技馆的电影。
上映18天流浪地球在内地总票房已高居第二超过了红海行动。
(截止2019年2月25号8:00票房数据)
当然今年的好票房有一部分源于高票价,那么看过这么影片的小伙伴到底如何评价呢,好票房是否有好口碑呢?且看小编的科学分析(主要是猫眼和豆瓣用户的影评数据)
技术小哥哥一共爬取到了12万余条影评信息,下面跟着小编一起来看看吧
这部电影更对男同胞的胃口:
(观影人员性别及情感分布)
影片关注度在2月10号到达顶峰,每天晚间档是观影高峰期:
(随日期变化评论数量趋势)
(各时段评论数量)
大部分用户还是打出了9分以上的评价:
(影评评分分布)
大家的主要评论关注“科幻”、“中国”:
(评论关键词词云图)
科幻、特效是大家评论的焦点:
(评论主旨分布)
(以上均为截止2019年2月22号17:00影评的数据分析)
这就是一个文科数据分析小白的分析了,还清各位客官指正哦!
很多人会好奇,一个不懂数据分析、不会Python、R编程的人,如何完成这样的“影评(文本)数据分析”呢?
其实除去数据爬取,整个分析小编只用了一个下午就完成了,是不是很腻害!!
那是因为小编有神器——Tempo大数据分析平台(从BI到AI的一体化数据分析与应用工具)的支撑,且看小编的表演:
基于TempoAI的文本分析模块中的分词、主旨话题分析和观点情感分析节点,进行简单的参数设置实现影评的话题和情感分析。“主旨话题”节点获可以直接获取评论中都讨论那些内容(如剧情、特效等),“情感分析”则可以识别用户评论的情感倾向(正面评价、负面评价,中立)。
而分词、关键词抽取和词频统计节点则实现影评焦点分析。“关键词抽取”获取影评的讨论焦点,“词频统计”则可以统计每个焦点的关注度,词云图就是评论热点的展示。
是不是全程都不用编写代码呢,Tempo平台智建模易应用的设计理念,让您在简单的拖拉拽中完成复杂的数据挖掘,是不是666啊。分析结果还可以直接输入并进行可视化展示!一样的不用编码,拖拖拽拽就搞定!!
平台“人人都是数据分析师”的理念,让不懂技术的小白比如身为文科生的小编通过简短的培训即可轻松完成复杂的数据分析挖掘工作。在实际应用中有很多场景都可以复用我们上述的操作,比如电商行业的用户评论分析、网络舆情分析、问卷调查分析、股票趋势分析、证券行业投资情报获取等场景,如果您有相关方面的需求可与我们取得联系~
您要是还对其他数据分析感兴趣的话可以私信wuli技术小哥哥,不过我是不会告诉你小哥哥的电话是4006082558滴~~