MATLAB爱好者论坛-LabFans.com

MATLAB爱好者论坛-LabFans.com (https://www.labfans.com/bbs/index.php)
-   资料存档 (https://www.labfans.com/bbs/forumdisplay.php?f=72)
-   -   从MATLAB Web浏览器保存HTML页面 (https://www.labfans.com/bbs/showthread.php?t=23326)

poster 2019-12-10 20:41

从MATLAB Web浏览器保存HTML页面
 
[URL="https://stackoverflow.com/questions/2610550/getting-data-into-matlab-from-https"]回答此问题后,[/URL]我在检索的页面上收到一条消息:“ [B]您的浏览器不支持JavaScript,因此某些功能可能会丢失![/B] ”

如果我在MATLAB网络浏览器中使用web(url)打开此页面并接受证书(每个会话一次),则该页面将正确打开。

如何使用脚本从浏览器保存页面源?还是从系统浏览器?还是即使没有浏览器也有办法获取该页面?

url='[url]https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525';[/url]

[B]回答:[/B]

从我可以判断的页面源下载情况来看,只要确保在本地打开保存的页面时让Javascript运行即可。

[...] [B]Your browser does not support JavaScript so some functionality may be missing![/B] [...] 请注意,您使用的[URL="https://stackoverflow.com/questions/1638275/handling-an-invalid-security-certificate-using-matlabs-urlread-command/1640099#1640099"]解决方案[/URL]仅下载网页,而没有附带任何内容(图像,.css,.js等)。

您可以做的是调用wget来获取包含所有文件的页面:

url = '[url]https://cgwb.nci.nih.gov/cgi-bin/hgTracks?position=chr7:55054218-55242525';[/url] command = ['wget --no-check-certificate --page-requisites ' url]; system( command ); 如果您使用的是Windows计算机,则始终可以从GnuWin32项目或[URL="http://www.google.com/search?q=wget+windows"]许多其他实现[/URL]之一获得wget。



[url=https://stackoverflow.com/questions/2656624]更多&回答...[/url]


所有时间均为北京时间。现在的时间是 02:09

Powered by vBulletin
版权所有 ©2000 - 2025,Jelsoft Enterprises Ltd.