美林数据
ABOUT US
美林数据技术股份有限公司(简称:美林数据,NEEQ:831546)是国内知名的数据治理和数据分析服务提供商。

大话数据挖掘之关联规则挖掘

2021-01-11 18:11:34
人物介绍
许教授:国内数据挖掘专家、某985高校智能信息处理学术带头人
赵总:某电力公司总经理
万总:某超市集团营销副总
姜局长:市卫生局副局长
李部长:某钢铁集团生产部部长
 
某985高校管理学院第五届EMBA班的《数据挖掘及其应用》课程上。
国内数据挖掘专家、智能信息处理学术带头人徐教授站在讲台上打开PPT说:“同学们,大家好!今天我们讲的是数据挖掘中的关联规则挖掘。”
“美国知名零售巨头沃尔玛在海量的交易数据中发现了美国人的一种行为模式:年龄在25~35岁的年轻父亲在给婴儿买尿布的同时,有30%~40%的会为自己买啤酒。”


啤酒与尿布

 “沃尔玛在发现这一现象后立即采取了行动,将卖场内原来相隔很远的妇婴用品区与酒类饮料区的空间距离拉近,使顾客更家方便。然后对本地区新育家庭的消费能力进行了调查,对这两个产品的价格也做了的调整,并向一次购买达到一定金额的顾客赠送婴儿奶嘴及其他小礼品,结果是尿布与啤酒的销售量双双大增。这就是轰动一时的啤酒与尿布的关联规则。”
“关联是指一个事件与另一个事件之间的依赖关系。关联规则挖掘就是发掘数据库中的关联关系。我们在网上购物时,商城的系统会主动推荐商品、赠送优惠券,并且这些推荐的商品和赠送的优惠券往往都能直抵我们的需求,诱导我们消费。这背后主要使用使用了关联分析技术,通过分析哪些商品经常一起购买,可以帮助商家了解用户的购买行为。大家还了解到哪些关联规则的应用?”徐教授问。
超市集团主管市场营销的万总抢先道:“徐老师,据我所知,关联规则已经成为各大超市安排商品布局,促进销售量的一种法宝。近年来,电信公司、保险公司和美容公司等服务行业都争先恐后地效仿零售业的这种做法,纷纷设计各种套餐,实现捆绑促销。”
电力公司的赵总:“在电力行业,一些发达国家通过关联分析对输变电设备进行状态检测,为状态检修计划的制定提供科学依据。”
卫生局江副局长:“国内外均有报道,有人将关联规则挖掘应用于临床疾病诊断,比如通过实例试图发现吸烟、环境污染、职业、肺部慢性疾病等因素与肺癌的发生之间的关联关系,从而发现肺癌疾病与它产生的可能因素间的规则,利用规则模式指导肺癌的诊断与预防。”
大家纷纷介绍本行业中关联规则的应用情况,令徐教授惊诧不已,不解地问:“你们怎么都知道这么多?”
学员们只笑不语。
李部长道出了其中的奥秘:“徐老师,谁都知道您上课的最大特点是激情豪迈,互动共鸣。我们EMBA班的学员都工作了数年,现能坐在教室充电,倍感机会来之不易,大家在您上课的先一天晚上都进行预习并准备与您配合的材料。”
徐教授高兴地笑了,接着说:“那我就要再问了,最基本的关联规则挖掘算法是什么?该算法的基本思想是什么?”
教室里鸦雀无语。
徐教授环视了一周,发现超市集团的万总跃跃欲试,便鼓励说:“万总,你试说说,不完全我来补充。”
万总鼓足了勇气,大声道:“最经典的关联规则算法是由Agrawal和Verkamo于1994年提出的Apriori算法,此后近十多年来,这方面的文章已达上万篇之多,但都是基于这种算法围绕着如何提高关联规则挖掘算法的效率、在海量数据集上进行关联规则提取、如何挖掘有价值的关联规则和关联规则的应用这些主题研究的。至于Apriori算法的思想……,我记不太清楚了。”
徐教授鼓励说:“回答的不错,可见课前准备花了很大功夫,值得表扬。”
徐教授的话音刚落,万总又开了口:“我记起来了,Apriori算法的基本思想是:首先从事件集中寻找所有频繁出现的事件子集,然后在这些频繁事件子集中发现可信度较高的规则。”
徐教授示意万总坐下,继续说:“Apriori算法的大概思想就是这样。由于许多应用问题往往更复杂,大量研究从不同的角度对关联规则做了扩展,将更多的因素集成到关联规则挖掘方法之中,以此丰富关联规则的应用领域,拓宽支持管理决策的范围。如考虑属性之间的类别层次关系,时态关系,多表挖掘等。近年来围绕关联规则的研究主要集中于两个方面,即扩展经典关联规则能够解决问题的范围,改善经典关联规则挖掘算法效率和规则兴趣性。”
关联规则算法

“今天关于关联规则挖掘的内容就介绍到这里。同学们,下节课见!”
服务热线
400-608-2558
咨询热线
029-88696198
美林数据
微信扫描二维码,立即在线咨询