Watson Explorer
Watson Explorer蜘蛛/爬虫属于搜索引擎类型,由IBM Corporation开发运行。您可以继续阅读下方信息,以深入了解Watson Explorer基本信息,用户代理和访问控制等。
基本信息
Watson Explorer的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
- 蜘蛛/爬虫名称
- Watson Explorer
- 类型
- 搜索引擎
- 开发商
-
IBM Corporation
- 当前状态
-
活动
用户代理
关于Watson Explorer蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
VSE/1.0
-
VSE/1.0
-
watson-url-fetcher
-
VSE/1.0
-
VSE/1.0
-
VSE/1.0
-
VSE/1.0
- 用户代理字符串
- VSE/1.0 (SimmeringStephenA@JohnDeere.com)
- 首次出现
- 2018-08-13 09:31:00
- 最后出现
- 2018-08-13 09:31:00
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
165.225.0.75 |
? |
US |
- 用户代理字符串
- watson-url-fetcher
- 首次出现
- 2017-12-13 07:12:28
- 最后出现
- 2018-02-16 14:23:56
- 遵循robots.txt
- 未知
- 来源
-
IP地址(2) |
服务器名称 |
所属国家 |
169.60.28.99 |
63.1c.3ca9.ip4.static.sl-reverse.com |
US |
169.46.107.204 |
cc.6b.2ea9.ip4.static.sl-reverse.com |
US |
- 用户代理字符串
- VSE/1.0 (jc_kim@jabil.com)
- 首次出现
- 2016-12-11 03:31:27
- 最后出现
- 2016-12-18 07:49:48
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
199.168.151.87 |
? |
US |
- 用户代理字符串
- VSE/1.0 (rabraham@multiview.com)
- 首次出现
- 2016-04-15 07:32:00
- 最后出现
- 2016-05-30 12:02:30
- 遵循robots.txt
- 未知
- 来源
-
IP地址(3) |
服务器名称 |
所属国家 |
199.185.0.216 |
? |
US |
199.185.0.214 |
? |
US |
199.185.0.215 |
? |
US |
- 用户代理字符串
- VSE/1.0 (mbahrepour@jibes.nl)
- 首次出现
- 2014-11-02 18:41:33
- 最后出现
- 2014-11-06 03:53:29
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
8.30.83.161 |
? |
US |
165.225.0.75 |
? |
US |
199.168.151.87 |
? |
US |
199.185.0.216 |
? |
US |
199.185.0.214 |
? |
US |
199.185.0.215 |
? |
US |
85.158.139.101 |
proxy5.messagelabs.net |
NL |
- 用户代理字符串
- VSE/1.0 (mbahrepour@jibes.nl)
- 首次出现
- 2014-11-02 18:41:33
- 最后出现
- 2014-11-06 03:53:29
- 遵循robots.txt
- 未知
- 来源
-
IP地址(1) |
服务器名称 |
所属国家 |
85.158.139.101 |
proxy5.messagelabs.net |
NL |
访问控制
了解如何控制Watson Explorer访问权限,避免Watson Explorer抓取行为不当。
是否拦截Watson Explorer?
一般不要拦截。搜索引擎爬虫为搜索引擎提供动力,是用户发现您网站的有效途径。事实上,拦截搜索引擎爬虫可能会严重减少网站的自然流量。
通过Robots.txt拦截
您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Watson Explorer 或限制其访问权限。我们建议安装 Spider Analyser
插件,以检查它是否真正遵循这些规则。
# robots.txt
# 下列代码一般情况可以拦截该代理
User-agent: Watson Explorer
Disallow: /
您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。