数据挖掘分析技术是什么?数据挖掘分析技术包括哪些技术?
数据挖掘分析技术就是对观测到的数据集(经常是很庞大的)进行分析,目的是发现未知的关系和以数据拥有者可以理解并对其有价值的新颖方式来总结分析大数据。
运用基于计算机的方法,包括新技术,从而在数据中获得有用知识的整个过程,就叫做数据挖掘分析技术。
数据挖掘分析技术怎么样,严格地说,数据挖掘分析技术并不是一个全新的领域,它颇有点“新瓶装旧酒”的意味。组成数据挖掘分析技术的三大支柱包括统计学、机器学习和数据库等领域内的研究成果,其它还包含了可视化、信息科学等内容。数据挖掘分析技术纳入了统计学中的回归分析、判别分析、聚类分析以及置信区间等技术,机器学习中的决策树、神经网络等技术,数据库中的关联分析、序列分析等技术。
1、模式跟踪
模式跟踪是数据挖掘分析技术的一项基本技术。它旨在通过识别和监视数据中的趋势或模式,以对业务成果形成智能推断。例如,企业可以用它来识别销售数据的发展趋势。如果发现某种产品在某些特定人群中的销售情况,要好于其他产品,那么该企业便可以据此来创建类似的产品或服务,甚至只是简单地为此类人群增加原始产品的库存。
2、数据清理和准备
数据清理和准备作为数据挖掘分析技术过程中的一个重要环节,我们必须对原始数据进行清理和格式化,以用于各种后续的分析。具体而言,数据清理和准备工作包含了:数据建模,转换,迁移,集成和聚合等各种元素。这是理解数据基本特征和属性,进而确定其最佳用途的必要步骤。
基于分类的数据挖掘分析技术技术,主要涉及到分析各种类型数据之间的关联属性。一旦确定了数据类型的关键特征,企业便可以对它们进行分类。企业可以据此判定是该保护,还是该删除某些个人身份信息。
3、异常值检测
异常值检测可被用于识别数据集中的异常情况。企业在发现数据中异常值后,可以通过防范此类事件的发生,以顺利实现业务目标。例如,信用卡系统在某个特定时段出现使用和交易的高峰,那么企业便可以通过分析了解到,可能是由于“大促”所致,并为将来的此类活动做好资源上的事先部署与准备。异常值检测也是数据挖掘分析技术一个很重要的技术方法。