> 工具>蜘蛛查询工具

MediaWiki crawler

MediaWiki crawler蜘蛛/爬虫属于类型，由Wikimedia Foundation Inc开发运行。您可以继续阅读下方信息，以深入了解MediaWiki crawler基本信息，用户代理和访问控制等。

基本信息

MediaWiki crawler的基本信息如下表。但部分不是很规范的蜘蛛和爬虫，可能存在信息不明的情况。

蜘蛛/爬虫名称: MediaWiki crawler

类型: 其他

开发商: Wikimedia Foundation Inc

当前状态: 活动

用户代理

关于MediaWiki crawler蜘蛛或者爬虫的用户代理字符串，IP地址和服务器，所在地等信息如下表格所示：

用户代理字符串: wlc3 Pywikibot/9.0.0.dev0 (g18371) requests/2.31.0 Python/3.10.12.final.0

首次出现: 2024-01-19 03:02:05

最后出现: 2024-01-19 03:02:05

遵循robots.txt: 未知

来源

IP地址(1)	服务器名称	所属国家
185.102.189.20	host-185-102-189-20.jmdi.pl	PL

用户代理字符串: wlc3 Pywikibot/8.0.0.dev0 (g17442) requests/2.28.1 Python/3.10.6.final.0

首次出现: 2023-01-04 22:21:24

最后出现: 2023-01-04 22:21:24

遵循robots.txt: 未知

来源

IP地址(1)	服务器名称	所属国家
185.102.189.20	host-185-102-189-20.jmdi.pl	PL

用户代理字符串: wlc3 Pywikibot/7.3.0.dev0 (g16522) requests/2.26.0 Python/3.8.10.final.0

首次出现: 2022-05-10 23:06:16

最后出现: 2022-05-10 23:06:16

遵循robots.txt: 未知

来源

IP地址(1)	服务器名称	所属国家
185.102.189.20	host-185-102-189-20.jmdi.pl	PL

用户代理字符串: wlc3 Pywikibot/7.0.0.dev0 (g15566) requests/2.26.0 Python/3.8.10.final.0

首次出现: 2021-10-28 19:23:30

最后出现: 2021-10-29 11:44:11

遵循robots.txt: 未知

来源

IP地址(1)	服务器名称	所属国家
185.102.189.20	host-185-102-189-20.jmdi.pl	PL

用户代理字符串: wlc3 Pywikibot/6.2.0.dev0 (g14905) requests/2.25.1 Python/3.8.5.final.0

首次出现: 2021-05-25 03:31:39

最后出现: 2021-05-25 03:31:39

遵循robots.txt: 未知

来源

IP地址(1)	服务器名称	所属国家
185.102.189.20	host-185-102-189-20.jmdi.pl	PL

访问控制

了解如何控制MediaWiki crawler访问权限，避免MediaWiki crawler抓取行为不当。

是否拦截MediaWiki crawler？

对于未知蜘蛛或者爬虫。它的用途对网站来说可能是好的，也可能是坏的，这取决于它是什么。所以说，这需要站长进一步分析判断这些尚不明确的爬虫行为，再作最终决定。但，根据以往的经验，未声明行为目的及未命名的蜘蛛爬虫，通常都有不可告人的秘密，我们理应对其行为进行控制，比如拦截。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 MediaWiki crawler 或限制其访问权限。我们建议安装 Spider Analyser 插件，以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: MediaWiki crawler
	Disallow: /

您无需手动执行此操作，可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

站长工具

我们为站长量身定做的高效工具集。

关键词查找工具

robots.txt测试工具

WordPress主题检测器

SEO优化中心

蜘蛛查询工具

查看全部工具

常见蜘蛛/爬虫

Common Spiders

DataForSeo bot蜘蛛/爬虫属于类型，由DataForSEO OU开发运行。您可以继续阅读下方信息，以深入了解DataForSeo bot基本信息，用户代理和访问控制等。

CloudFlare crawler

CloudFlare crawler蜘蛛/爬虫属于类型，由CloudFlare, Inc.开发运行。您可以继续阅读下方信息，以深入了解CloudFlare crawler基本信息，用户代理和访问控制等。

Odin蜘蛛/爬虫属于类型，由Cyble, Inc.开发运行。您可以继续阅读下方信息，以深入了解Odin基本信息，用户代理和访问控制等。

Chrome Privacy Preserving Prefetch Proxy

Chrome Privacy Preserving Prefetch Proxy蜘蛛/爬虫属于类型，由Google Inc.开发运行。您可以继续阅读下方信息，以深入了解Chrome Privacy Preserving Prefetch Proxy基本信息，用户代理和访问控制等。

EFF crawler蜘蛛/爬虫属于类型，由Electronic Frontier Foundation开发运行。您可以继续阅读下方信息，以深入了解EFF crawler基本信息，用户代理和访问控制等。

Modat crawler蜘蛛/爬虫属于类型，由Modat B.V.开发运行。您可以继续阅读下方信息，以深入了解Modat crawler基本信息，用户代理和访问控制等。

FirmoGraph蜘蛛/爬虫属于类型，由firmograph.io开发运行。您可以继续阅读下方信息，以深入了解FirmoGraph基本信息，用户代理和访问控制等。

fluid蜘蛛/爬虫属于类型，由leak.info开发运行。您可以继续阅读下方信息，以深入了解fluid基本信息，用户代理和访问控制等。

相关文章

Related Articles

WordPress的wp_is_mobile()函数还有用吗？特色图

WordPress的wp_is_mobile()函数还有用吗？

WordPress 3.4 引入的 wp_is_mobile() 函数允许开发者判别访客设备类型，从而优化内容输出，尽管随着移动设备性能提升，其应用场景有所变化。

如何使用WordPress数据包管理应用程序状态特色图

如何使用WordPress数据包管理应用程序状态

管理任何 WordPress 应用程序的状态（如何处理和组织数据）都是一项挑战。随着项目的发展，跟踪数据流并确保各组件更新的一致性变得越来越困难。WordPress 数据包可以在这方面提供帮助，因为它为状态管理提供了一个强大的解决方案。本文将介绍 WordPress 数据包，探讨其关键概念、实施策略和最佳实践。

10种适用于标题和正文的免费英文字体组合特色图

10种适用于标题和正文的免费英文字体组合

为你的设计项目选择合适的英文字体对于实现理想的外观和感觉至关重要。下面是一些适用于标题和正文的免费英文字体组合，以及对可使用这些英文字体的项目和网站类型的建议。

2025年最值得了解的用户界面设计趋势特色图

2025年最值得了解的用户界面设计趋势

用户界面/用户体验（UI/UX）领域是一个充满创意和创新的快速旋转木马。随着 2025 年的临近，设计师们正以前所未有的姿态投入到创意和用户至上的体验中。让我们深入探讨今年你需要关注（和拥抱）的顶级趋势！

2025年网页设计的10大趋势特色图

2025年网页设计的10大趋势

随着我们步入 2025 年，网页设计趋势正在大踏步前进，将创新与功能性融为一体，创造出引人入胜的数字体验。以下是今年影响未来网页设计的突出趋势。

独立站链接建设不可忽略的77个技巧特色图

独立站链接建设不可忽略的77个技巧

链接建设在SEO中至关重要，但应优先进行内容与On-Page优化。本文详解外链类型、链接质量和链接建设策略，强调质量、相关性和用户体验的重要性。

Cloudflare 15年超长时效免费SSL证书申请和部署教程特色图

Cloudflare 15年超长时效免费SSL证书申请和部署教程

本文介绍了通过 Cloudflare 申请有效期长达 15 年的免费 SSL 证书的方法，强调其与国内云服务提供商三个月免费证书的对比及相关申请和部署步骤。

如何创建XML网站地图（Sitemap）以更符合搜索引擎收录要求特色图

如何创建XML网站地图（Sitemap）以更符合搜索引擎收录要求

为您的网站添加网站地图，谷歌、百度和必应就会更好地索引所有内容？要是这么简单就好了。XML 网站地图是网站优化中最容易被误解的工具。然而，正确实施网站地图可以极大地影响搜索引擎对网站的感知和抓取。