Matlab：如何处理异常数据文件 - MATLAB爱好者论坛-LabFans.com

poster · 2019-12-10, 20:48

我正在尝试将大量文件导入Matlab进行处理。一个典型的文件如下所示：

mass intensity 350.85777 238 350.89252 3094 350.98688 2762 351.87899 468 352.17712 569 352.28449 426 Some text and numbers here, describing the experimental setup, eg Scan 3763 @ 81.95, contains 1000 points: 两列中的数字用8个空格分隔。但是，有时实验会出错，并且计算机会生成这样的数据文件：

mass intensity Some text and numbers here, describing the experimental setup, eg Scan 3763 @ 81.95, contains 1000 points: 我发现使用带有单个标题行的以空格分隔的文件，即

importdata(path_to_file,' ', 1); 最适合普通文件。但是，它对所有异常文件完全失败。解决此问题的最简单方法是什么？我应该坚持使用importdata（已经尝试了所有可能的设置，但实际上不起作用）还是应该尝试编写自己的解析器？理想情况下，对于常规文件，我希望在Nx2矩阵中获得这些值，对于异常文件，我想获得[0 0]。

谢谢。

回答：

我认为您不需要创建自己的解析器，也不是那么异常。在这里，使用textscan是最好的选择。

fid = fopen('input.txt', 'rt'); data = textscan(fid, '%f %u', 'Headerlines', 1); fclose(fid); mass = data{1}; intensity = data{2}; 产量：

mass = 350.8578 350.8925 350.9869 351.8790 352.1771 352.2845 intensity = 238 3094 2762 468 569 426 对于您的第一个文件，以及：

mass = Empty matrix: 0-by-1 intensity = Empty matrix: 0-by-1 为了您的空虚。

默认情况下，文本扫描将空格作为分隔符读取，并且仅读取您告诉它的内容，直到不再能够读取为止。因此，它会忽略文件中的最后几行。如果要提取其他字段，也可以在此之后进行第二次文本扫描：

fid = fopen('input.txt', 'rt'); data = textscan(fid, '%f %u', 'Headerlines', 1); mass = data{1}; intensity = data{2}; data = textscan(fid, '%*s %u %*c %f %*c %*s %u %*s', 'Headerlines', 1); scan = data{1}; level = data{2}; points = data{3}; fclose(fid); 连同您的质量和强度数据可以得出：

scan = 3763 level = 81.9500 points = 1000

更多&回答...

2019-12-10, 20:48	#1
poster 高级会员注册日期: 2019-11-21 帖子: 3,025 声望力: 67	Matlab：如何处理异常数据文件我正在尝试将大量文件导入Matlab进行处理。一个典型的文件如下所示： mass intensity 350.85777 238 350.89252 3094 350.98688 2762 351.87899 468 352.17712 569 352.28449 426 Some text and numbers here, describing the experimental setup, eg Scan 3763 @ 81.95, contains 1000 points: 两列中的数字用8个空格分隔。但是，有时实验会出错，并且计算机会生成这样的数据文件： mass intensity Some text and numbers here, describing the experimental setup, eg Scan 3763 @ 81.95, contains 1000 points: 我发现使用带有单个标题行的以空格分隔的文件，即 importdata(path_to_file,' ', 1); 最适合普通文件。但是，它对所有异常文件完全失败。解决此问题的最简单方法是什么？我应该坚持使用importdata（已经尝试了所有可能的设置，但实际上不起作用）还是应该尝试编写自己的解析器？理想情况下，对于常规文件，我希望在Nx2矩阵中获得这些值，对于异常文件，我想获得[0 0]。谢谢。回答：我认为您不需要创建自己的解析器，也不是那么异常。在这里，使用textscan是最好的选择。 fid = fopen('input.txt', 'rt'); data = textscan(fid, '%f %u', 'Headerlines', 1); fclose(fid); mass = data{1}; intensity = data{2}; 产量： mass = 350.8578 350.8925 350.9869 351.8790 352.1771 352.2845 intensity = 238 3094 2762 468 569 426 对于您的第一个文件，以及： mass = Empty matrix: 0-by-1 intensity = Empty matrix: 0-by-1 为了您的空虚。默认情况下，文本扫描将空格作为分隔符读取，并且仅读取您告诉它的内容，直到不再能够读取为止。因此，它会忽略文件中的最后几行。如果要提取其他字段，也可以在此之后进行第二次文本扫描： fid = fopen('input.txt', 'rt'); data = textscan(fid, '%f %u', 'Headerlines', 1); mass = data{1}; intensity = data{2}; data = textscan(fid, '%s %u %c %f %c %s %u %*s', 'Headerlines', 1); scan = data{1}; level = data{2}; points = data{3}; fclose(fid); 连同您的质量和强度数据可以得出： scan = 3763 level = 81.9500 points = 1000 更多&回答...