poster
2019-12-10, 20:41
回答此问题后, (https://stackoverflow.com/questions/2610550/getting-data-into-matlab-from-https)我在检索的页面上收到一条消息:“ 您的浏览器不支持JavaScript,因此某些功能可能会丢失! ”
如果我在MATLAB网络浏览器中使用web(url)打开此页面并接受证书(每个会话一次),则该页面将正确打开。
如何使用脚本从浏览器保存页面源?还是从系统浏览器?还是即使没有浏览器也有办法获取该页面?
url='https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525';
回答:
从我可以判断的页面源下载情况来看,只要确保在本地打开保存的页面时让Javascript运行即可。
[...] Your browser does not support JavaScript so some functionality may be missing! [...] 请注意,您使用的解决方案 (https://stackoverflow.com/questions/1638275/handling-an-invalid-security-certificate-using-matlabs-urlread-command/1640099#1640099)仅下载网页,而没有附带任何内容(图像,.css,.js等)。
您可以做的是调用wget来获取包含所有文件的页面:
url = 'https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525'; command = ['wget --no-check-certificate --page-requisites ' url]; system( command ); 如果您使用的是Windows计算机,则始终可以从GnuWin32项目或许多其他实现 (http://www.google.com/search?q=wget+windows)之一获得wget。
更多&回答... (https://stackoverflow.com/questions/2656624)
如果我在MATLAB网络浏览器中使用web(url)打开此页面并接受证书(每个会话一次),则该页面将正确打开。
如何使用脚本从浏览器保存页面源?还是从系统浏览器?还是即使没有浏览器也有办法获取该页面?
url='https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525';
回答:
从我可以判断的页面源下载情况来看,只要确保在本地打开保存的页面时让Javascript运行即可。
[...] Your browser does not support JavaScript so some functionality may be missing! [...] 请注意,您使用的解决方案 (https://stackoverflow.com/questions/1638275/handling-an-invalid-security-certificate-using-matlabs-urlread-command/1640099#1640099)仅下载网页,而没有附带任何内容(图像,.css,.js等)。
您可以做的是调用wget来获取包含所有文件的页面:
url = 'https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525'; command = ['wget --no-check-certificate --page-requisites ' url]; system( command ); 如果您使用的是Windows计算机,则始终可以从GnuWin32项目或许多其他实现 (http://www.google.com/search?q=wget+windows)之一获得wget。
更多&回答... (https://stackoverflow.com/questions/2656624)