查看单个帖子
旧 2019-12-10, 20:41   #1
poster
高级会员
 
注册日期: 2019-11-21
帖子: 3,006
声望力: 66
poster 正向着好的方向发展
帖子 从MATLAB Web浏览器保存HTML页面

回答此问题后,我在检索的页面上收到一条消息:“ 您的浏览器不支持JavaScript,因此某些功能可能会丢失!

如果我在MATLAB网络浏览器中使用web(url)打开此页面并接受证书(每个会话一次),则该页面将正确打开。

如何使用脚本从浏览器保存页面源?还是从系统浏览器?还是即使没有浏览器也有办法获取该页面?

url='https://cgwb.nci.nih.gov/cgi-bin/hgT...55242525';

回答:

从我可以判断的页面源下载情况来看,只要确保在本地打开保存的页面时让Javascript运行即可。

[...] Your browser does not support JavaScript so some functionality may be missing! [...] 请注意,您使用的解决方案仅下载网页,而没有附带任何内容(图像,.css,.js等)。

您可以做的是调用wget来获取包含所有文件的页面:

url = 'https://cgwb.nci.nih.gov/cgi-bin/hgT...55242525'; command = ['wget --no-check-certificate --page-requisites ' url]; system( command ); 如果您使用的是Windows计算机,则始终可以从GnuWin32项目或许多其他实现之一获得wget。



更多&回答...
poster 当前离线   回复时引用此帖