WebThumb

WebThumb蜘蛛/爬虫属于快照类型,由Joshua Eichorn开发运行。您可以继续阅读下方信息,以深入了解WebThumb基本信息,用户代理和访问控制等。

基本信息

WebThumb的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
WebThumb
类型
快照
开发商
Joshua Eichorn
当前状态
活动

用户代理

关于WebThumb蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
WebThumb/2.0
用户代理字符串
Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.69 Safari/537.36 Webthumb/2.0
首次出现
2016-10-04 17:59:46
最后出现
2017-01-23 08:24:56
遵循robots.txt
来源
IP地址(2) 服务器名称 所属国家
149.28.231.7 webthumb.bluga.net US
45.63.5.39 webthumb.bluga.net US
104.238.130.175 docker8.bluga.net US
45.76.165.32 docker7.bluga.net US
65.49.79.91 ? US
65.49.79.92 ? US
用户代理字符串
Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.69 Safari/537.36 Webthumb/2.0
首次出现
2016-10-04 17:59:46
最后出现
2017-01-23 08:24:56
遵循robots.txt
来源
IP地址(2) 服务器名称 所属国家
65.49.79.91 ? US
65.49.79.92 ? US
用户代理字符串
Mozilla/5.0 (X11; U; Linux i686 (x86_64); en-US; rv:1.9.2.19) Gecko WebThumb/1.0
首次出现
2015-02-05 13:24:55
最后出现
2016-04-16 10:28:24
遵循robots.txt
来源
IP地址(6) 服务器名称 所属国家
65.49.79.91 65.49.79.91 US
65.49.79.91 ? US
65.49.79.93 65.49.79.93 US
65.49.79.93 65.49.79.93 US
65.49.79.92 65.49.79.92 US

访问控制

了解如何控制WebThumb访问权限,避免WebThumb抓取行为不当。

是否拦截WebThumb?

这取决于你。数字存档通常是为了保存历史记录。如果你出于某种原因不想成为历史记录的一部分,你可以拦截这类型的蜘蛛爬虫。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 WebThumb 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: WebThumb
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

常见蜘蛛/爬虫

Common Spiders
Googlebot
GoogleBot蜘蛛/爬虫属于搜索引擎类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解GoogleBot基本信息,用户代理和访问控制等。
SeznamBot
SeznamBot蜘蛛/爬虫属于搜索引擎类型,由Seznam.cz, a.s.开发运行。您可以继续阅读下方信息,以深入了解SeznamBot基本信息,用户代理和访问控制等。
WordPress.com bots
WordPress.com bots蜘蛛/爬虫属于信息流类型,由Automattic Inc.开发运行。您可以继续阅读下方信息,以深入了解WordPress.com bots基本信息,用户代理和访问控制等。
Hatena
Hatena蜘蛛/爬虫属于获取器类型,由Hatena Co., Ltd.开发运行。您可以继续阅读下方信息,以深入了解Hatena基本信息,用户代理和访问控制等。
hyperhost.ua crawler
hyperhost.ua crawler蜘蛛/爬虫属于快照类型,由HyperHost Ukraine开发运行。您可以继续阅读下方信息,以深入了解hyperhost.ua crawler基本信息,用户代理和访问控制等。
bingbot
Bingbot蜘蛛/爬虫属于搜索引擎类型,由Microsoft Corporation.开发运行。您可以继续阅读下方信息,以深入了解Bingbot基本信息,用户代理和访问控制等。
PhantomJsCloud.com
PhantomJsCloud.com蜘蛛/爬虫属于快照类型,由Novaleaf Software Co. Ltd.开发运行。您可以继续阅读下方信息,以深入了解PhantomJsCloud.com基本信息,用户代理和访问控制等。
Daumoa
Daumoa蜘蛛/爬虫属于搜索引擎类型,由Kakao Corp.开发运行。您可以继续阅读下方信息,以深入了解Daumoa基本信息,用户代理和访问控制等。

相关文章

Related Articles