poster
2019-12-10, 16:49
我需要一个正则表达式,它将解析一个csv样式的文件,大约57个字段宽,大多数字段都用引号引起来(但可能不是全部),并用逗号分隔,其中带引号的字段有可能嵌入表示形式的双精度("")评估字符串中的单引号。
我是一名正则表达式初学者/中级,我认为我可以很快了解基本表达式以进行字段解析,但这是我无法理解的嵌入式双引号(和逗号)。
任何人? (这并不重要,但特定的语言是Matlab。)
回答:
如果您真的需要使用正则表达式,那么我将分两步进行;首先,将逗号分开,例如:
regexp(theString, '(? 仅当没有前面的斜杠时,这应该在逗号上分开(我假设这是转义的逗号表示的意思)。 (我认为在matlab中,您最终将获得原始字符串的索引数组)
然后,您应该检查每个匹配的字段中是否有转义的引号,并将其替换为:
regexprep(individualString, '""', '"'); 逗号类似:
regexprep(individualString, '\\,', ','); 我不确定在matlab中没有太多经验的双逃逸\。
正如其他人所说,最好使用csv库来处理初始文件。
更多&回答... (https://stackoverflow.com/questions/1027236)
我是一名正则表达式初学者/中级,我认为我可以很快了解基本表达式以进行字段解析,但这是我无法理解的嵌入式双引号(和逗号)。
任何人? (这并不重要,但特定的语言是Matlab。)
回答:
如果您真的需要使用正则表达式,那么我将分两步进行;首先,将逗号分开,例如:
regexp(theString, '(? 仅当没有前面的斜杠时,这应该在逗号上分开(我假设这是转义的逗号表示的意思)。 (我认为在matlab中,您最终将获得原始字符串的索引数组)
然后,您应该检查每个匹配的字段中是否有转义的引号,并将其替换为:
regexprep(individualString, '""', '"'); 逗号类似:
regexprep(individualString, '\\,', ','); 我不确定在matlab中没有太多经验的双逃逸\。
正如其他人所说,最好使用csv库来处理初始文件。
更多&回答... (https://stackoverflow.com/questions/1027236)