首席数据官

Hi, 请登录

这5种数据挖掘技术,大数据玩的贼溜!

数据挖掘涉及“处理数据和识别信息中的模式和趋势”,根据IBM所说,“数据挖掘原理已经存在了许多年,但是随着大数据的出现,它更为流行了。”

IBM估计,仅过去的两年就产生了世界上百分之九十的数据。每天人们产生2.5兆字节的数据,足以填满1000万个蓝光光盘。

数据挖掘技术帮助专业人员了解可用数据集。这些技术可以为企业和其他组织提供描述性和预测性的能力。

数据挖掘封面

5个数据挖掘技术

01关联规则

关联规则使两个或多个项之间的关联以确定它们之间的模式。例如,超市可以确定顾客在买草莓时也常买鲜奶油,反之亦然。关联通常用于销售点系统,以确定产品之间的共同趋势。

关联规则

大数据可视化_大数据可视化系统_大数据可视化技术

“这是一个非常简单的方法,但你会惊讶与其中有多少智慧和洞察,它可以提供许多企业的日常使用的信息,来提高效率和增加收入,根据科技公司Galvanize的说法。应用领域包括物品的实物摆放组织、市场营销和产品的交叉销售和上销。

02分类

我们可以使用多个属性来标记特定类别的项。分类将项目分配到目标类别或类中,以便准确地预测该类内部会发生什么。

某些行业会将客户进行分类。例如大数据可视化技术,一家信贷公司可以使用分类模型来确定贷款申请人的低、中或高信用风险。其他组织将当前和目标受众分为不同年龄和社会团体进行营销活动。

03聚类

“聚类是将数据记录组合在一起的方法”根据Alex Berson、Stephen Smith和Kurt Thearling在Building Data Mining Applications for CRM这本书中所说。“通常这样做是为了让最终用户对数据库中发生的事情有一个高层次的认识。”

聚类

大数据可视化系统_大数据可视化技术_大数据可视化

查看对象分组情况可以帮助市场细分领域的企业。在这个例子中可以使用聚类将市场细分为客户子集。然后,每个子集可以根据簇的属性来制定特定的营销策略,例如在一个簇中与另一个簇中的客户的购买模式的对比。

04决策树

决策树用于分类或预测数据。决策树从一个简单的问题开始大数据可视化技术,它有两个或多个的答案。每个答案将会引出进一步的问题,该问题又可被用于分类或识别可被进一步分类的数据,或者可以基于每个答案进行预测。

决策树

应用决策树图分析手机供应商如何分类流失的客户,或不更新手机的客户。Building Data Mining Applications for CRM的作者为决策树图的构建提供了一些有趣的值得借鉴的东西。

将数据分成多个叶结点,所有叶结点的数据记录数的加和等于输入数据的记录总数。例如,父结点中的数据记录总数等于其两个子结点中包含的记录总和。

当在决策树上上下移动时,流失前和流失后的客户数量是需要存储的。

大数据可视化_大数据可视化技术_大数据可视化系统

能够很容易的

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址
二维码
评论