MuckRack

MuckRack蜘蛛/爬虫属于信息搜集类型,由Muck Rack, LLC开发运行。您可以继续阅读下方信息,以深入了解MuckRack基本信息,用户代理和访问控制等。

基本信息

MuckRack的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
MuckRack
类型
信息搜集
开发商
Muck Rack, LLC
当前状态
活动

用户代理

关于MuckRack蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
MuckRack/1.0
用户代理字符串
Mozilla/5.0 (compatible; MuckRack/1.0; +https://muckrack.com)
首次出现
2019-07-19 17:46:28
最后出现
2022-10-26 08:59:00
遵循robots.txt
来源
IP地址(18) 服务器名称 所属国家
45.33.80.220 45-33-80-220.ip.linodeusercontent.com US
45.79.164.250 45-79-164-250.ip.linodeusercontent.com US
23.239.11.145 li688-145.members.linode.com US
173.255.236.143 li246-143.members.linode.com US
173.255.236.178 li246-178.members.linode.com US
66.228.34.72 li284-72.members.linode.com US
45.56.103.37 li905-37.members.linode.com US
45.79.174.73 li1273-73.members.linode.com US
66.175.215.187 li526-187.members.linode.com US
45.56.111.5 li913-5.members.linode.com US
139.144.234.134 139-144-234-134.ip.linodeusercontent.com US

访问控制

了解如何控制MuckRack访问权限,避免MuckRack抓取行为不当。

是否拦截MuckRack?

可能不需要,尤其是如果你自己也受益于信息搜集服务。不过,如果你担心服务器资源占用等问题,可以选择拦截它们。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 MuckRack 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: MuckRack
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

常见蜘蛛/爬虫

Common Spiders

相关文章

Related Articles