MATLAB爱好者论坛-LabFans.com

MATLAB爱好者论坛-LabFans.com (https://www.labfans.com/bbs/index.php)
-   资料存档 (https://www.labfans.com/bbs/forumdisplay.php?f=72)
-   -   最新的维数算法 (https://www.labfans.com/bbs/showthread.php?t=26581)

poster 2019-12-14 20:13

最新的维数算法
 
我们知道有一些算法可以减少数据集的尺寸,例如PCA和Isomap
[LIST][*]在将维降到数据集方面,最新技术是什么?[*]您是否有示例,也许在MATLAB上?[/LIST]假设我们有一个具有100,000个属性的数据集,例如[URL="http://archive.ics.uci.edu/ml/datasets/Dorothea"]Dorothea数据集[/URL] (以结构分子特征表示的化合物必须分类为有活性(与凝血酶结合)或无活性。这是NIPS 2003特征选择挑战的5个数据集之一。)

Data Set Characteristics: Multivariate Number of Instances: 1950 Area: Life Attribute Characteristics: Integer Number of Attributes: 100000 Date Donated 2008-02-29 Associated Tasks: Classification Missing Values? N/A Number of Web Hits: 17103

[B]回答:[/B]

特定于Matlab,您可以从[URL="http://www.mathworks.com/help/pdf_doc/stats/stats.pdf"]统计工具箱[/URL]的手册中获取一些想法。

查找“特征选择”和“特征转换”部分。另外,我会尝试SVD,FastMap和RobustMap。您需要阅读一些有关每种数据的知识,并确定哪种数据最适合您的数据。



[url=https://stackoverflow.com/questions/5284032]更多&回答...[/url]


所有时间均为北京时间。现在的时间是 09:07

Powered by vBulletin
版权所有 ©2000 - 2025,Jelsoft Enterprises Ltd.