# 概述

# 1. 数据挖掘基本任务

利用分类与预测、聚类分析、关联分析、时序分析、偏差分析、智能推荐等方法,帮助企业提取数据中蕴含的商业价值,提高企业的核心竞争力。

# 2. 数据挖掘的建模过程

  • 目标定义
  • 数据采集
  • 数据整理
  • 构建模型
  • 模型评估
  • 模型上线

# 2.1 定义挖掘目标

针对不同的数据挖掘应用需求,我们需要了解目标领域的相关知识,熟悉背景知识,弄清客户需求。

通常来讲,定义目标可以细致的分为任务理解、指标确立这两个步骤。

这里以电商平台为例来阐述:

对于任务理解来讲,我们通常希望采取一定的策略使得商家的利润增加、同时也使得消费者满意度增加,达到双赢的效果。

以消费者的角度来看,我们在购买商品的时候,往往会因为商品数量过多,无法对所有的商品有所了解,因此,如何使得消费者能快速的找到满意的商品对提高消费者的满意度有很高的价值。

对于商家来讲,不同的消费者往往在购买时往往会有不同的消费习惯,例如,经常购买的往往会一次性买很多,而不经常买的往往会选择一部分先进行观望,这样如果能把这些用户分开,对不同的用户采取不同的营销策略,也可以进一步实现提高用户满意度、利润增加;同时,在不同的季节,消费者购买所关注点也是不同的,若能将其区分开来,同样也可解决商家货供给不足、消费者需求无法很好的满足的问题。

在经过初步的任务理解后,已经对要做的事有了一个大致的了解,接着就需要对其建立详细的指标,由于指标的建立往往需要实际的业务经验,这里暂时不过多描述。

# 2.2 数据取样

在明确了数据挖掘的目标后,接下来就是需要获取数据,我们在分析时,不可能拿全部数据进行分析,因为这样耗时耗力,通常采取取样方法,获取样本子集。在取样的同时,还需要特别关注数据的质量,若是数据有误,那么根据数据进行后续操作往往会造成误导,从而得到错误的结论,所以在取样是要注重数据的完整性和有效性。

# 衡量数据质量:指标齐全、数据正常 (数据不正常往往是服务器等出现问题导致的)

抽样方法采用统计学的抽样方法即可。

# 2.3 数据探索

在拿到数据后,我们往往会想找到其中的规律,比如各个数据之间有没有什么关联等等,这些都是需要探索的问题。

Edited on

Give me a cup of [coffee]~( ̄▽ ̄)~*

Mr2 WeChat Pay

WeChat Pay