poster
2019-12-14, 20:13
我正在读取心律不齐 (http://archive.ics.uci.edu/ml/machine-learning-databases/arrhythmia/arrhythmia.data)的数据集,并且缺少某些属性(发生这种情况时,它们会显示“ ? ”)。例如:
... 64, -2, ?, 63, 0, ... 我应该如何看待这个例子?在进行一些统计分析时,摆脱未知值是否更好?
如何删除包含'的数据?在MATLAB中?
回答:
要转换字符串,请使用TEXTSCAN (http://www.mathworks.com/help/techdoc/ref/textscan.html)和STR2DOUBLE (http://www.mathworks.com/help/techdoc/ref/str2double.html) ,它们将用NaN替换丢失的值(对于许多统计分析,您不想只删除该值,而是想知道丢失的内容)。统计工具箱的大多数功能以及诸如plot都可以处理NaN 。
例如
tmp = textscan('-2,**?**,63,0','%s','delimiter',',') str2double(tmp{1}) ans = -2 NaN 63 0
更多&回答... (https://stackoverflow.com/questions/5237500)
... 64, -2, ?, 63, 0, ... 我应该如何看待这个例子?在进行一些统计分析时,摆脱未知值是否更好?
如何删除包含'的数据?在MATLAB中?
回答:
要转换字符串,请使用TEXTSCAN (http://www.mathworks.com/help/techdoc/ref/textscan.html)和STR2DOUBLE (http://www.mathworks.com/help/techdoc/ref/str2double.html) ,它们将用NaN替换丢失的值(对于许多统计分析,您不想只删除该值,而是想知道丢失的内容)。统计工具箱的大多数功能以及诸如plot都可以处理NaN 。
例如
tmp = textscan('-2,**?**,63,0','%s','delimiter',',') str2double(tmp{1}) ans = -2 NaN 63 0
更多&回答... (https://stackoverflow.com/questions/5237500)