火车头采集文章列表地址列表错误 URL多了一层网址解决方法

大标 2022年9月16日02:40:48网络推广评论0阅读模式
机车收集文章列表,地址列表错误,URL是一层。解决方案:

今天,我再次打开机车收集器,需要更新网站,但点击开始后发现错误。玉石修订了名单收集规则。我没有仔细看。我将300多个连接导入数据库时出错。我仔细查看了站点的文章列表页面,并处理了文章的URL地址。

性能:

常规文章列表文章URL应为<a href=”https://www.jiaidc.com.com/url.html “> 并且站将其处理为<a href=”//www.jiaidc.com.com/url。html“>它是取消协议头HTTPS或HTTP,这在一定程度上可以阻止许多收集程序、软件和爬虫。收集后,地址列表将有一个额外的URL层https://www.jiaidc.com/www.jiaidc.com.com/url.html这样,无法正确收集内容。

解决方案:

点击URL获取选项中的“手动填写链接地址规则",

填写[a href=”[参数]&358221;类=&8221;标题;目标=”_空白”】这里的参数是没有协议头的原始当前URL。

实际连接:填写[http:[参数1]]如果网站是HTTPS,则填写[HTTPS:[参数2]]

结果:

以上操作完成后,点击即可正确进行网站测试,从收款到入库,一切正常。

<strong>PS:

这个网址问题在搜狐之前就已经出现过。使用DEDECM收集它是一个web地址错误。今天,它终于在机车上解决了。

我希望这篇文章能对你有所帮助。

weinxin
我的微信
微信扫一扫
大标
  • 本文由 发表于 2022年9月16日02:40:48
  • 转载请务必保留本文链接:https://www.tanhuibiao.com/3600.html
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: