本文目录一览:
怎么爬取网页的动态内容,很多都是js动态生
抓取动态页面有两种常用的方法,一是通过JavaScript逆向工程获取动态数据接口(真实的访问路径),另一种是利用selenium库模拟真实浏览器,获取JavaScript渲染后的内容。但selenium库用起来比较繁琐,抓取速度相对较慢,所以第一种方法日常使用较多。
网页的动态JS在哪找?
可以在开发者工具当中找。
打开开发者工具,然后选择网络(network),在下面的列表就可以看到动态加载的js文件了。如果文件比较多,可以选js进行筛选。
如果不是js文件,是在页面当中的js,可以在开发者工具的元素(elements)面板里面找到文档当中的js。
如何在html页面动态加载js文件
html页面动态加载js文件脚本的方法。
1、直接document.write
script language="javascript"
document.write("script src='test.js'\/script");
/script
2、动态改变已有script的src 属性
script src='' id="s1"/script
script language="javascript"
s1.src="test.js"
/script
3、动态创建 script元素
script
var oHead = document.getElementsByTagName('HEAD').item(0);
var oScript= document.createElement("script");
oScript.type = "text/javascript";
oScript.src="test.js";
oHead.appendChild( oScript);
/script
这三种方法都是异步的,所以在采用这类方法动态加载Js的同时,主界面的Js脚本是继续执行的,所以可能出现通过异步加载的Js代码得不到预期的效果的情况。