博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
分级聚类算法
阅读量:7225 次
发布时间:2019-06-29

本文共 873 字,大约阅读时间需要 2 分钟。

 

  分级聚类算法以一组对应于原始数据项的聚类开始。函数的主循环部分会尝试每一组可能的配对并计算他们的相关度,以此来找出最佳配对。最佳配对的两个聚类会被合并成一个新的聚类。新生成的聚类中所包含的数据,等于将两个旧聚类的数据求均值之后得到的结果。循环下去,一直到只剩下一个聚类为止。

python实现代码:

def hcluster(rows,distance=pearson):  distances={}  currentclustid=-1  # Clusters are initially just the rows  clust=[bicluster(rows[i],id=i) for i in range(len(rows))]  while len(clust)>1:    lowestpair=(0,1)    closest=distance(clust[0].vec,clust[1].vec)    print "closest",closest    # loop through every pair looking for the smallest distance    for i in range(len(clust)):      for j in range(i+1,len(clust)):        # distances is the cache of distance calculations        if (clust[i].id,clust[j].id) not in distances:           distances[(clust[i].id,clust[j].id)]=distance(clust[i].vec,clust[j].vec)        d=distances[(clust[i].id,clust[j].id)]        if d

 

转载于:https://www.cnblogs.com/huanhuanang/p/5242784.html

你可能感兴趣的文章
使用微信登录
查看>>
有关在hyper-V上安装红帽redhat 6.1网卡相关问题
查看>>
解决ssh连接一段时间后光标无响应问题
查看>>
2012-3-16 - 一周心情
查看>>
宽依赖与窄依赖区别
查看>>
samba服务
查看>>
Oracle数据库迁移方案
查看>>
linux磁盘及文件系统管理的部分知识一
查看>>
shell daemon init.d/functions 守护进程 lock文件
查看>>
我的友情链接
查看>>
删除exchange2010公用文件夹数据库
查看>>
python3实现excel里面读数据进行排序
查看>>
我的友情链接
查看>>
C# XML 文档注释
查看>>
Asp.Net文件的上传和下载
查看>>
Linux进程管理
查看>>
Spring Boot cache backed guava/caffeine
查看>>
windows下nginx+tomcat集群,实现session复制共享
查看>>
EHCache工具类
查看>>
Spring简单整合ibatis
查看>>