Labfans是一个针对大学生、工程师和科研工作者的技术社区。 论坛首页 | 联系我们(Contact Us)
MATLAB爱好者论坛-LabFans.com
返回   MATLAB爱好者论坛-LabFans.com > 其它 > 资料存档
资料存档 资料存档
回复
 
主题工具 显示模式
旧 2019-12-14, 20:13   #1
poster
高级会员
 
注册日期: 2019-11-21
帖子: 3,006
声望力: 66
poster 正向着好的方向发展
帖子 最新的维数算法

我们知道有一些算法可以减少数据集的尺寸,例如PCA和Isomap
  • 在将维降到数据集方面,最新技术是什么?
  • 您是否有示例,也许在MATLAB上?
假设我们有一个具有100,000个属性的数据集,例如Dorothea数据集 (以结构分子特征表示的化合物必须分类为有活性(与凝血酶结合)或无活性。这是NIPS 2003特征选择挑战的5个数据集之一。)

Data Set Characteristics: Multivariate Number of Instances: 1950 Area: Life Attribute Characteristics: Integer Number of Attributes: 100000 Date Donated 2008-02-29 Associated Tasks: Classification Missing Values? N/A Number of Web Hits: 17103

回答:

特定于Matlab,您可以从统计工具箱的手册中获取一些想法。

查找“特征选择”和“特征转换”部分。另外,我会尝试SVD,FastMap和RobustMap。您需要阅读一些有关每种数据的知识,并确定哪种数据最适合您的数据。



更多&回答...
poster 当前离线   回复时引用此帖
回复


发帖规则
不可以发表新主题
不可以发表回复
不可以上传附件
不可以编辑自己的帖子

启用 BB 代码
论坛禁用 表情符号
论坛启用 [IMG] 代码
论坛启用 HTML 代码



所有时间均为北京时间。现在的时间是 20:34


Powered by vBulletin
版权所有 ©2000 - 2025,Jelsoft Enterprises Ltd.