Labfans是一个针对大学生、工程师和科研工作者的技术社区。 论坛首页 | 联系我们(Contact Us)
MATLAB爱好者论坛-LabFans.com
返回   MATLAB爱好者论坛-LabFans.com > 其它 > 资料存档
资料存档 资料存档
回复
 
主题工具 显示模式
旧 2019-12-10, 20:48   #1
poster
高级会员
 
注册日期: 2019-11-21
帖子: 3,006
声望力: 66
poster 正向着好的方向发展
帖子 以k表示选择簇数

我想聚类大量数据,为此我在MATLAB中使用了k均值函数。问题是它返回一个矩阵,其中所有数据都按我指定的簇数排序。

我怎么知道哪个簇是最佳的。

我以为,如果我在每个群集中得到相等数量的元素,那将是最佳选择,但这永远不会发生。相反,它可以继续对我输入的任何数字进行数据聚类。

请帮忙...



回答:

我读了一下,我认为对此的答案可能是:-在kmeans中,我们试图根据数据出现时的方式对数据进行分区,因此从理论上讲,我们最好的数据集将是每个分区具有相等数量的数据。

我使用kmeans ++是一种比kmeans更好的算法,因为它不初始化随机值,然后遍历分区的数量直到分区的大小几乎相等。这是一个大概的数字,比如说3我得到2180,729,1219,而4我得到30,2422,1556,120,所以我选择3作为我的最终答案.......



更多&回答...
poster 当前离线   回复时引用此帖
回复


发帖规则
不可以发表新主题
不可以发表回复
不可以上传附件
不可以编辑自己的帖子

启用 BB 代码
论坛禁用 表情符号
论坛启用 [IMG] 代码
论坛启用 HTML 代码



所有时间均为北京时间。现在的时间是 01:19


Powered by vBulletin
版权所有 ©2000 - 2025,Jelsoft Enterprises Ltd.