聚类算法有哪些

聚类算法有:划分法、层次法、密度算法、图论聚类法、网格算法、模型算法 。
1、划分法
划分法(partitioning methods) , 给定一个有N个元组或者纪录的数据集 , 分裂法将构造K个分组 , 每一个分组就代表一个聚类 , K<N 。使用这个基本思想的算法有:K-MEANS算法、K-MEDOIDS算法、CLARANS算法 。
2、层次法
层次法(hierarchical methods) , 这种方法对给定的数据集进行层次似的分解 , 直到某种条件满足为止 。具体又可分为“自底向上”和“自顶向下”两种方案 。代表算法有:BIRCH算法、CURE算法、CHAMELEON算法等 。
3、密度算法
基于密度的方法(density-based methods) , 基于密度的方法与其它方法的一个根本区别是:它不是基于各种各样的距离的 , 而是基于密度的 。这样就能克服基于距离的算法只能发现“类圆形”的聚类的缺点 。代表算法有:DBSCAN算法、OPTICS算法、DENCLUE算法等 。
4、图论聚类法
图论聚类方法解决的第一步是建立与问题相适应的图 , 图的节点对应于被分析数据的最小单元 , 图的边(或弧)对应于最小处理单元数据之间的相似性度量 。因此 , 每一个最小处理单元数据之间都会有一个度量表达 , 这就确保了数据的局部特性比较易于处理 。图论聚类法是以样本数据的局域连接特征作为聚类的主要信息源 , 因而其主要优点是易于处理局部数据的特性 。
【聚类算法有哪些】5、网格算法

聚类算法有哪些

文章插图

基于网格的方法(grid-based methods) , 这种方法首先将数据空间划分成为有限个单元(cell)的网格结构,所有的处理都是以单个的单元为对象的 。代表算法有:STING算法、CLIQUE算法、WAVE-CLUSTER算法 。
6、模型算法
基于模型的方法(model-based methods) , 基于模型的方法给每一个聚类假定一个模型 , 然后去寻找能够很好的满足这个模型的数据集 。通常有两种尝试方向:统计的方案和神经网络的方案 。
扩展资料:
聚类分析起源于分类学 , 在古老的分类学中 , 人们主要依靠经验和专业知识来实现分类 , 很少利用数学工具进行定量的分类 。随着人类科学技术的发展 , 对分类的要求越来越高 , 以致有时仅凭经验和专业知识难以确切地进行分类 , 于是人们逐渐地把数学工具引用到了分类学中 , 形成了数值分类学 , 之后又将多元分析的技术引入到数值分类学形成了聚类分析 。聚类分析内容非常丰富 , 有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等 。
在商业上 , 聚类可以帮助市场分析人员从消费者数据库中区分出不同的消费群体来 , 并且概括出每一类消费者的消费模式或者说习惯 。它作为数据挖掘中的一个模块 , 可以作为一个单独的工具以发现数据库中分布的一些深层的信息 , 并且概括出每一类的特点 , 或者把注意力放在某一个特定的类上以作进一步的分析;并且 , 聚类分析也可以作为数据挖掘算法中其他分析算法的一个预处理步骤 。
参考资料:百度百科-聚类算法

    推荐阅读