关联规则最初是为了解决购物篮问题而产生。购物篮分析(Market Basket Analysis) 20世纪90年代 大概是1993年 Agrawal等人第一次提出了关联规则的概念。到目前为止 我们最熟悉的故事就是啤酒和尿布的故事。
故事原型 90年代 数据库技术飞速发展。作为大型的米国连锁超市 沃尔玛自然而然的引进了这套数据库系统。据说有一个叫做Joke的年轻人 在数据分析中发现 啤酒和尿布这两种完全不着边际的商品竟然有很高的概率一起被购买 这引起了他的兴趣。在一段时间之后 他终于分析出了原因
在美国有婴儿的家庭中 一般是母亲在家中照看婴儿 年轻的父亲去超市买尿布。父亲在购买尿布的同时 往往会顺便为自己购买啤酒。所以尿布和啤酒一起出现的概率就很高。
所以他采取的方式方法是
在超市里将尿布和啤酒放在相邻的位置
结果是销量大增
2. 质疑 关联规则是真的吗在做这个课题之前 没有仔细了解过关联规则。但是深入了解后 啤酒和尿布的故事似乎是假的
质疑1 没有找到Joke的任何相关信息
质疑2 故事不是发生在沃尔玛
据找到的不一定真实的文章
The myth itself relates to a study done in June of 1992 when Thomas Blischok, then VP of industrial consulting for NCR (now spun off to TeraData), did an analysis for Osco Drug. They examined 1.2 million market baskets in 25 stores identifying over 20 different product couplings including beer and diapers, and fruit juice and cough syrup.
可以看出 1992年 研究者们调查了25家商店的120万个购物篮 确定了20多种不同的产品组合 包括啤酒、尿布、果汁和止咳糖浆。
质疑3 研究得出的结论不相关
What the Osco and the NCR study did was create a fundamental understanding that buying habits could be used to enhance the whole buying experience. Twenty years later, data mining has been upgraded to business intelligence and predictive analytics. Companies can now think through how and what people buy and layout stores more efficiently. They can offer coupons on items bought together, and have extra stock when demand is going to increase.
可以看出 研究得出的结论是发放 这个年代 的优惠券 非常超前。
质疑4 啤酒和尿布两件商品放在一起会引起某些顾客的反感。
关联规则是确实存在的。即使这个故事是编的 他也只是激起我们学习的兴趣 让我们思考。因此不应该因为它是假的就不去学习 况且你只是怀疑。关联规则类的算法不能说多么的高大上 但是确实很实用。该类算法存在并且应用了这么多年 肯定是有它存在的道理。
4. 什么是关联规则百度百科中这么说
关联规则是形如X→Y的蕴涵式 其中 X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) 。其中 关联规则XY 存在支持度和信任度。~
简单理解 就是X和Y之间的某种关系。什么关系呢 —把X,Y进行关联分析 得出两者之中的关系。关联和规则 关联和规则 关联后去挖掘之中的规则。
5. 应用场景或许不说应用场景 可能不太清楚关联规则到底是干嘛的。下面意义列举
新闻推荐。你有没有注意过 你的手机 电脑经常给你推荐一些新的内容 而你对这些内容感兴趣的概率很大 想过其中的原因没 当然不仅仅限于新闻 音乐 电影 电视剧…购物推荐。想想你的拼多多 淘宝 京东 还有广告 他们经常出现的页面到底和你的行为有啥关系 气象关联分析。农林牧副渔 哪些行业的发展和天气相关 第二第三产业 比如石油化工 服务旅游等。这些行业的数据汇总和天气进行分析 是不是很有利于国家的发展 精准营销和价格预测。 你的外卖 你的滴滴 是否存在大数据杀熟。推销电话 理财 贷款电话为啥会找到你。交通事故原因分析。最近在做一个伴随车辆 车辆落脚点分析等研究 简直是量身定做。其他还有很多求职招聘推荐 保险投保人分组 搜索引擎 银行金融客户交叉销售分析等。当然 上面的内容不一定非要用关联规则类算法 但是关联规则算法确实能解决这些类的问题。
本文链接: http://oscodrug.immuno-online.com/view-773419.html