时间:2021-05-26
复制代码 代码如下:
/**
* 判断是否为搜索引擎蜘蛛
*
* @author Eddy
* @return bool
*/
function isCrawler() {
$agent= strtolower($_SERVER['HTTP_USER_AGENT']);
if (!empty($agent)) {
$spiderSite= array(
"TencentTraveler",
"Baiduspider+",
"BaiduGame",
"Googlebot",
"msnbot",
"Sosospider+",
"Sogou web spider",
"ia_archiver",
"Yahoo! Slurp",
"YoudaoBot",
"Yahoo Slurp",
"MSNBot",
"Java (Often spam bot)",
"BaiDuSpider",
"Voila",
"Yandex bot",
"BSpider",
"twiceler",
"Sogou Spider",
"Speedy Spider",
"Google AdSense",
"Heritrix",
"Python-urllib",
"Alexa (IA Archiver)",
"Ask",
"Exabot",
"Custo",
"OutfoxBot/YodaoBot",
"yacy",
"SurveyBot",
"legs",
"lwp-trivial",
"Nutch",
"StackRambler",
"The web archive (IA Archiver)",
"Perl tool",
"MJ12bot",
"Netcraft",
"MSIECrawler",
"WGet tools",
"larbin",
"Fish search",
);
foreach($spiderSite as $val) {
$str = strtolower($val);
if (strpos($agent, $str) !== false) {
return true;
}
}
} else {
return false;
}
}
网上倒是能搜到一大把,不过都是千篇一律的复制来复制去的,也不够全面,我这里整理了一份比较全面的代码:
复制代码 代码如下:
function is_spider(){
$robot = 0;
$USER_AGENT = strtolower($_SERVER['HTTP_USER_AGENT']);
if(strpos($USER_AGENT,"bot")) $robot = 1;
if(strpos($USER_AGENT,"spider")) $robot = 1;
if(strpos($USER_AGENT,"slurp")) $robot = 1;
if(strpos($USER_AGENT,"mediapartners-google")) $robot = 1;
if(strpos($USER_AGENT,"fast-webcrawler")) $robot = 1;
if(strpos($USER_AGENT,"altavista")) $robot = 1;
if(strpos($USER_AGENT,"ia_archiver")) $robot = 1;
if($robot == 1){
//do something
}
return '';
}
声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。
清晰且对搜索引擎友好的导航,不仅可以便于访客浏览,更易于搜索引擎蜘蛛的抓取。网站建设今天为大家带来的是网站导航SEO优化教程。一、网站导航的作用1、判断自己所在
本文实例讲述了php实现判断访问来路是否为搜索引擎机器人的方法。分享给大家供大家参考。具体分析如下:很多时候我们需要对网站访客来路进行识别,针对真实用户与搜索引
一、搜索引擎蜘蛛搜索引擎蜘蛛又称网页爬虫。目的:抓取高质量的网页内容。下面讲几个常见的搜索引擎蜘蛛分类:1.1Baiduspider(百度蜘蛛)百度公司还有其它
1.给搜索引擎蜘蛛制造陷阱搜索引擎不是傻瓜,当搜索引擎在蜘蛛传达的数据中发现网站收录情况一下子好多,就会去检查蜘蛛,当发现蜘蛛掉进无限循环的蜘蛛陷阱中去的时候,
我们了解过什么是搜索引擎蜘蛛后,就应该了解下什么是robots.txt,因为前面介绍搜索引擎蜘蛛是按照链接爬行的,有的时候我不希望搜索引擎蜘蛛爬行并抓取,比如网