引言:本文为数据挖掘技术(第三版)第一章读书笔记

数据挖掘的良性循环包含了四个步骤
  1. 识别业务机会;
  2. 挖掘数据将其转换为可操作的信息;
  3. 根据信息采取行动;
  4. 度量结果;

根据以上步骤的提示,成功的关键是把数据挖掘合并到业务流程,并能促进数据挖掘人员与使用结果的业务用户之间的通信。

1.识别业务机会
数据挖掘的良性循环首先在于识别合适的业务机会。为了避免浪费分析工作,受限应愿意针对结果采取行动。数据挖掘很适用于以下几类业务。
  • 规划新的产品介绍
  • 计划直接营销活动
  • 理解客户的流失/波动
  • 评价营销测试的结果
  • 分配营销预算以吸引最有利可图的客户

    度量过去的努力和有关业务的特设问题同时启示数据挖掘的机会:

    • 什么类型的客户会影响过去的活动?
    • 最好的客户住在哪里?
    • 在自动柜员机前漫长的等待是客户流失的原因嘛?
    • 有利可图的客户会使用客户支持嘛?
    • 哪些产品应该使用Clorox漂白来升级?
2.将数据转换为信息
 数据挖掘的重点是讲数据转换为可操作的结果。但是许多缺陷降低了使用数据挖掘的能力:
  • 坏的数据格式,例如客户地址中不包含邮政编码
  • 混乱的数据字段,例如交货日期在一个系统定义为“计划交付日期”,在另一个系统定义为 “实际交付日期”
  • 功能缺陷,例如呼叫中心系统不允许对每个客户进行备注
  • 法律影响
  • 组织因素,因为业务部门不愿意改变他们的行动,特别是没有奖励的情况下
  • 不及时,因为结果可能来得太晚而不再适合采取行动
3.根据信息采取行动
采取行动是数据挖掘良性循环的目的,数据挖掘可以使业务更加明智,随着时间的推进,更明智的决定会促成更佳的结果。
  • 当客户在线时,把结果合并到推荐系统
  • 通过直接邮寄,电子邮件,电话营销等向客户和潜在客户发送消息;使用数据挖掘,不同的信息应该发送给不同的人
  • 优先客户服务
  • 调整库存水平

数据挖掘的结果必须交给可以接触到客户或影响客户关系的核心业务流程

4.度量结果

需要使用可度量的结果来验证行动的结果,分为以下四个组进行验证。

  • 目标组:接受处置,且具有指示响应的模型评分
  • 控制组:接受处置,且随机或基于较低的模型评分进行选择
  • 对照组:不接受处置,且随机或基于较低的模型评分进行选择
  • 模型化对照组:不接受处置,且具有指示响应的模型评分
控制组:随机选择,接收信息。响应度量没有模型的信息 目标组:通过模型选择;接收信息。响应度量了带模型的信息
对照组:随机选择,不接收信息。响应度量基准的响应 模型化对照组:通过模型选择;不接收信息。响应度量了不带信息时的模型

以活动为例,多去思考下以下几个问题。

  • 该活动是否抵达并带来有利可图的客户?
  • 得分更高的模型评分会表明更高的响应度嘛?
  • 这些客户是被保留还是可预期?
  • 本活动所出大的最忠实客户的特征是什么?
  • 新获得的顾客会购买额外的产品吗?
  • 一些信息或优惠比其他的更有效嘛?
  • 活动所触达的客户可通过其他备用渠道触达嘛?