登录论坛

查看完整版本 : MATLAB中的特征选择


poster
2019-12-10, 20:48
我已经准备好在MATLAB中使用文本分类数据集。每个文档都是该数据集中的一个向量,并且该向量的维数非常高。在这些情况下,peopl通常会对向量进行某些功能选择,例如您实际找到的WEKA工具包。 MATLAB中有类似的东西吗?如果不能,那么我可以建议我做些什么...吗?谢谢



回答:

MATLAB(及其工具箱)包括许多处理功能选择的功能:


RANDFEATURES (http://www.mathworks.com/help/bioinfo/ref/randfeatures.html) (生物信息学工具箱):生成分类器指导的随机特征子集
RANKFEATURES (http://www.mathworks.com/help/bioinfo/ref/rankfeatures.html) (生物信息学工具箱):按类可分离性标准对要素进行 (http://www.mathworks.com/help/bioinfo/ref/rankfeatures.html)排名
SEQUENTIALFS (http://www.mathworks.com/help/stats/sequentialfs.html) (统计工具箱):顺序特征选择
RELIEFF (http://www.mathworks.com/help/stats/relieff.html) (统计工具箱):Relief-F算法
TREEBAGGER.OOBPermutedVarDeltaError (https://www.mathworks.com/help/stats/treebagger.oobpermutedvardeltaerror.html) , predictorImportance (https://www.mathworks.com/help/stats/compactclassificationensemble.predictorimportance.html) (统计工具箱):使用集成方法(袋装决策树)
您还可以找到示例来说明在实际数据集上的用法:


识别重要特征并分类蛋白质谱 (https://www.mathworks.com/help/bioinfo/examples/identifying-significant-features-and-classifying-protein-profiles.html)
遗传算法搜索质谱数据特征 (https://www.mathworks.com/help/bioinfo/examples/genetic-algorithm-search-for-features-in-mass-spectrometry-data.html)
此外,还存在第三方工具箱:


用于降维的Matlab工具箱 (http://lvdmaaten.github.io/drtoolbox/)
LIBGS:用于基因选择的MATLAB软件包 (http://web.archive.org/web/20090430124306/https://users.cs.fiu.edu/~yzhan004/genesel.html)
否则,您总是可以直接从MATLAB中从WEKA调用您喜欢的函数,因为它包含JVM ...



更多&回答... (https://stackoverflow.com/questions/4419070)