Labfans是一个针对大学生、工程师和科研工作者的技术社区。 | 论坛首页 | 联系我们(Contact Us) |
![]() |
![]() |
#1 |
高级会员
注册日期: 2019-11-21
帖子: 3,006
声望力: 66 ![]() |
![]()
我想聚类大量数据,为此我在MATLAB中使用了k均值函数。问题是它返回一个矩阵,其中所有数据都按我指定的簇数排序。
我怎么知道哪个簇是最佳的。 我以为,如果我在每个群集中得到相等数量的元素,那将是最佳选择,但这永远不会发生。相反,它可以继续对我输入的任何数字进行数据聚类。 请帮忙... 回答: 我读了一下,我认为对此的答案可能是:-在kmeans中,我们试图根据数据出现时的方式对数据进行分区,因此从理论上讲,我们最好的数据集将是每个分区具有相等数量的数据。 我使用kmeans ++是一种比kmeans更好的算法,因为它不初始化随机值,然后遍历分区的数量直到分区的大小几乎相等。这是一个大概的数字,比如说3我得到2180,729,1219,而4我得到30,2422,1556,120,所以我选择3作为我的最终答案....... 更多&回答... |
![]() |
![]() |