
保存模板可引用的数据
#网址#采集的原始网址
#标题#网址对应的网页标题
#描述#网页标题下面的一段描述文字
#域名#原始网址的域名部分,如“http://test.shuimiao.net/123.htm”中的“test.shuimiao.net”
#顶级域名#取原始网址的顶级域名部分,如“http://test.shuimiao.net/123.htm”中的“shuimiao.net”
常见问题
一、不同批次关键词采集的结果为什么会存在部分网址重复?尤其是只引用了 #域名# 或 #顶级域名# 之后,这种部分网址重复的情况比较多。这也是正常的,因为每个网站的内页可能包含很多主题,不同关键词都可能采集到该网站的不同内页,当引用域名后,相同网站的不同内页的域名结果自然就相同了。
二、为什么采集回来的网址的主题与关键词不符?
是因为引用了 #域名# 或 #顶级域名# 后,取的是域名部分,域名打开的是该网站的首页,而采集的原网址可能不是首页,而是该网站的某一篇文章的内页,该内页包含关键词主题,因此被搜索引擎收录,软件才能采集得到。但取域名后,你打开的域名首页就不一定包含该关键词。
为了比对采集是否正确,可以在保存模板里输入:<a href="#网址#" target="_blank">#标题#</a>,保存为htm文件,采集完后可以自己打开该文件查看比对。
三、为什么采集一段时间之后,无法采集?
这可能采集多了被搜索引擎限制。一般换个IP(如使用VPN换IP)即可继续采集,如果不换,只能等待搜索引擎取消屏蔽之后才能继续采集。百度的屏蔽时间通常半小时到数小时。
不过,现在即使出现验证码屏蔽,软件也会弹出验证码手动输入的(百度、谷歌)


驱动人生10
360解压缩软件2023
看图王2345下载|2345看图王电脑版 v10.9官方免费版
WPS Office 2019免费办公软件
QQ浏览器2023 v11.5绿色版精简版(去广告纯净版)
下载酷我音乐盒2023
酷狗音乐播放器|酷狗音乐下载安装 V2023官方版
360驱动大师离线版|360驱动大师网卡版官方下载 v2023
【360极速浏览器】 360浏览器极速版(360急速浏览器) V2023正式版
【360浏览器】360安全浏览器下载 官方免费版2023 v14.1.1012.0
【优酷下载】优酷播放器_优酷客户端 2019官方最新版
腾讯视频播放器2023官方版
【下载爱奇艺播放器】爱奇艺视频播放器电脑版 2022官方版
2345加速浏览器(安全版) V10.27.0官方最新版
【QQ电脑管家】腾讯电脑管家官方最新版 2024