亚洲精品国产电影午夜在线观看|欧美va免费精品高清在线|亚洲综合无码一区二区三区|国产日产久久高清欧美一区ww|伊人久久大香线蕉综合AV|91麻豆精品91久久久久久清纯

合肥做網(wǎng)站,選擇瘋狗科技,專(zhuān)業(yè)、敬業(yè)的合肥網(wǎng)絡(luò )公司
首頁(yè) > 網(wǎng)站SEO優(yōu)化 > 詳情

百度蜘蛛Baiduspider的真假如何分辨

2021-01-26 15:25:06   來(lái)源:黎青松SEO博客   瀏覽:  次
實(shí)際上,我們的日志中,有很多的baiduspider是他人偽裝的,要想解決這個(gè)問(wèn)題。我們必須在驗證baiduspider真偽上下功夫,這篇文章詳細的介紹了爬蟲(chóng)的鑒別方法。我們在根據網(wǎng)站日志分析搜索引擎蜘蛛抓取網(wǎng)頁(yè)的記錄時(shí),實(shí)際上很多

實(shí)際上,我們的日志中,有很多的baiduspider是他人偽裝的,要想解決這個(gè)問(wèn)題。我們必須在驗證baiduspider真偽上下功夫,這篇文章詳細的介紹了爬蟲(chóng)的鑒別方法。

我們在根據網(wǎng)站日志分析搜索引擎蜘蛛抓取網(wǎng)頁(yè)的記錄時(shí),實(shí)際上很多站點(diǎn)都是有一些偽裝稱(chēng)baiduspider的到訪(fǎng)者的。這些數據會(huì )嚴重影響我們對日志分析后的判斷。

這些到訪(fǎng)者,為什么會(huì )偽裝為baiduspider來(lái)訪(fǎng)問(wèn)我們的網(wǎng)站呢?最典型的就是采集你內容的那些人。他們知道很多工具是能夠看到哪些ip訪(fǎng)問(wèn)網(wǎng)站的量過(guò)大的。例如某一個(gè)ip今天訪(fǎng)問(wèn)你網(wǎng)站1萬(wàn)次,那正常嗎?肯定是不正常的。但他要是baiduspdier呢?呵呵,那就正常了。

Mozilla/5.0(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(Linux;u;Android4.2.2;zh-cn;)AppleWebKit/534.46(KHTML,likeGecko)Version/5.1MobileSafari/10600.6.3(compatible;Baiduspider/2.0;+http://www.baidu.com/search/spider.html)

Mozilla/5.0(iPhone;CPUiPhoneOS9_1likeMacOSX)AppleWebKit/601.1.46(KHTML,likeGecko)Version/9.0Mobile/13B143Safari/601.1(compatible;Baiduspider-render/2.0;+http://www.baidu.com/search/spider.html)

如上是包含了百度的常規爬蟲(chóng),和渲染爬蟲(chóng)render的。這兩個(gè)爬蟲(chóng)的區別符已經(jīng)用紅色字體標出來(lái)了。

可以通過(guò)DNS反查方式來(lái)解決這個(gè)問(wèn)題。根據平臺不同驗證方法不同,如linux/windows/os三種平臺下的驗證方法分別如下:

1、在linux平臺下,您可以使用hostip命令反解ip來(lái)判斷是否來(lái)自Baiduspider的抓取。Baiduspider的hostname以.baidu.com或.baidu.jp的格式命名,非.baidu.com或.baidu.jp即為冒充。

2、在windows平臺或者IBMOS/2平臺下,您可以使用nslookupip命令反解ip來(lái)判斷是否來(lái)自Baiduspider的抓取。打開(kāi)命令處理器輸入nslookupxxx.xxx.xxx.xxx(IP地址)就能解析ip,來(lái)判斷是否來(lái)自Baiduspider的抓取,Baiduspider的hostname以.baidu.com或.baidu.jp的格式命名,非.baidu.com或.baidu.jp即為冒充。

3、在macos平臺下,您可以使用dig命令反解ip來(lái)判斷是否來(lái)自Baiduspider的抓取。打開(kāi)命令處理器輸入digxxx.xxx.xxx.xxx(IP地址)就能解析ip,來(lái)判斷是否來(lái)自Baiduspider的抓取,Baiduspider的hostname以.baidu.com或.baidu.jp的格式命名,非.baidu.com或.baidu.jp即為冒充。

文章來(lái)源:黎青松SEO博客

亚洲精品国产电影午夜在线观看|欧美va免费精品高清在线|亚洲综合无码一区二区三区|国产日产久久高清欧美一区ww|伊人久久大香线蕉综合AV|91麻豆精品91久久久久久清纯 固阳县| 洪泽县| 泌阳县| 靖远县| 类乌齐县| 买车| 云阳县| 桂林市| 舞阳县| 大丰市| 乌拉特前旗| 福建省| 和田市| 休宁县| 罗平县| 石渠县| 竹北市| 吉林市| 浦城县| 嫩江县| 临江市| 兴安盟| 武川县| 班玛县| 南充市| 靖江市| 白玉县| 兰西县| 临沂市| 儋州市| 内江市| 安多县| 香港| 齐齐哈尔市| 贞丰县| 天峻县| 彝良县| 祁阳县| 兰溪市| 大埔区| 六安市| http://444 http://444 http://444 http://444 http://444 http://444