• 欢迎访问一然博客,WordPress信息,WordPress教程,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站,欢迎加入一然博客 QQ群
  • Git主题现已支持滚动公告栏功能,兼容其他浏览器,看到的就是咯,在后台最新消息那里用li标签添加即可。
  • 最新版Git主题已支持说说碎语功能,可像添加文章一样直接添加说说,新建说说页面即可,最后重新保存固定连接,演示地址
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏一然博客吧

火车头采集ajax瀑布流网站教程

火车头 一然 8个月前 (03-16) 366次浏览 未收录 0个评论

个人站长做网站大多喜欢采集,因为人力物力有限,没办法像门户站那样自己创造资源,大批量的转载文章也比较累,采集文章成了一个省时省力的办法,轻轻松松获得百万文章数据。火车头采集器是一款十分优秀的国产采集工具,免费版也十分强大,而火车头采集器破解版之类,这里不做评价,大家还应尊重版权,毕竟免费版已经很强了。

常规文章采集简单,而采集瀑布流、点击加载、下拉加载这种类ajax式的列表页面就比较困难了,让很多新手无从下手,CMS大学特别整理本篇文章,教大家在使用帝国cms采用火车头采集器进行采集时,如何采集这些页面。

首先目标页面需要抓包,简单站的抓json数据即可,如果壳网等;难一些的站需要post方式,还需要填cookie、随机值,如蘑菇街等。

今天咱们先来个简单的,以采果壳网为例进行说明。

首先需要使用的是chrome浏览器(调试帝国cms模板时也推荐使用chrome浏览器)。

一、首先在目标页面按F12或Ctrl+Shift+C打开审查元素,然后点Network选项卡。

火车头采集ajax瀑布流网站教程
二、点击XHR按钮,在页面上触发ajax加载,浏览器即监测到页面的数据执行和变化,红框中即为抓取到的数据地址。
火车头采集ajax瀑布流网站教程
三、点击数据地址,右侧出现详细信息,注意观察请求地址url的规律,例如下图中,有时间戳和页面序号。
火车头采集ajax瀑布流网站教程
火车头采集ajax瀑布流网站教程
四、在火车头采集器中添加如下抓取到的地址,并设置好地址规则,然后便是常规的火车头设置了。
火车头采集ajax瀑布流网站教程

 

火车头采集ajax瀑布流网站教程

 

火车头采集ajax瀑布流网站教程

 

火车头采集ajax瀑布流网站教程
至此,这个让很多帝国cms小白望而却步的ajax页面采集就做完了,大家还有什么好点子,也欢迎一起交流。

极客公园 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:火车头采集ajax瀑布流网站教程
喜欢 (0)
[]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址