以k表示选择簇数 - MATLAB爱好者论坛-LabFans.com

poster · 2019-12-10, 20:48

我想聚类大量数据，为此我在MATLAB中使用了k均值函数。问题是它返回一个矩阵，其中所有数据都按我指定的簇数排序。

我怎么知道哪个簇是最佳的。

我以为，如果我在每个群集中得到相等数量的元素，那将是最佳选择，但这永远不会发生。相反，它可以继续对我输入的任何数字进行数据聚类。

请帮忙...

回答：

我读了一下，我认为对此的答案可能是：-在kmeans中，我们试图根据数据出现时的方式对数据进行分区，因此从理论上讲，我们最好的数据集将是每个分区具有相等数量的数据。

我使用kmeans ++是一种比kmeans更好的算法，因为它不初始化随机值，然后遍历分区的数量直到分区的大小几乎相等。这是一个大概的数字，比如说3我得到2180,729,1219，而4我得到30,2422，1556,120，所以我选择3作为我的最终答案.......

更多&回答...

2019-12-10, 20:48	#1
poster 高级会员注册日期: 2019-11-21 帖子: 3,025 声望力: 67	以k表示选择簇数我想聚类大量数据，为此我在MATLAB中使用了k均值函数。问题是它返回一个矩阵，其中所有数据都按我指定的簇数排序。我怎么知道哪个簇是最佳的。我以为，如果我在每个群集中得到相等数量的元素，那将是最佳选择，但这永远不会发生。相反，它可以继续对我输入的任何数字进行数据聚类。请帮忙... 回答：我读了一下，我认为对此的答案可能是：-在kmeans中，我们试图根据数据出现时的方式对数据进行分区，因此从理论上讲，我们最好的数据集将是每个分区具有相等数量的数据。我使用kmeans ++是一种比kmeans更好的算法，因为它不初始化随机值，然后遍历分区的数量直到分区的大小几乎相等。这是一个大概的数字，比如说3我得到2180,729,1219，而4我得到30,2422，1556,120，所以我选择3作为我的最终答案....... 更多&回答...