Nicecrawler

Nicecrawler,由Unknown Author开发的爬虫类型蜘蛛/爬虫,当前为活动状态。

基本信息

Nicecrawler的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
Nicecrawler
开发商
Unknown Author
当前状态
活动

用户代理

关于Nicecrawler蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
请选择代理
Nicecrawler/1.1
用户代理字符串
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Nicecrawler/1.1; +http://www.nicecrawler.com/) Chrome/90.0.4430.97 Safari/537.36
类型
爬虫
首次出现
2021-06-30 23:50:18
最后出现
2024-11-24 02:07:56
遵循robots.txt
IP地址
12
来源
IP地址 服务器名称 所属国家
69.160.160.58 crawler-58.nicecrawler.com US
69.160.160.56 crawler-56.nicecrawler.com US
69.160.160.52 crawler-52.nicecrawler.com US
69.160.160.51 crawler-51.nicecrawler.com US
69.160.160.60 69.160.160.60 US
69.160.160.59 69.160.160.59 US
69.160.160.55 crawler-55.nicecrawler.com US
69.160.160.53 crawler-53.nicecrawler.com US
69.160.160.54 crawler-54.nicecrawler.com US
69.160.160.61 69.160.160.61 US
69.160.160.50 crawler-50.nicecrawler.com US
69.160.160.57 crawler-57.nicecrawler.com US

访问控制

了解如何控制Nicecrawler访问权限,避免Nicecrawler抓取行为不当。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 Nicecrawler 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: Nicecrawler
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。