vuhuvBot vuhuvBot

蜘蛛/爬虫名称
vuhuvBot
开发商
Vuhuv
官网
vuhuv.com
当前状态
活动
  • vuhuvBot/1.0
用户代理字符串
Mozilla/5.0 (compatible; vuhuvBot/1.0; +http://vuhuv.com/bot.html)
类型
搜索引擎
首次出现
2019-03-17 12:25:32
最后出现
2022-12-22 14:41:54
遵循robots.txt
IP地址
4
来源
IP地址 服务器名称 所属国家
194.9.191.20 bot.vuhuv.com GB
185.93.54.51 bot.vuhuv.net TR
162.158.90.215 ? DE
162.158.90.227 ? DE

Vuhuv Bot

vuhuv使用一个自行开发的机器人来抓取互联网,目前它访问的网站有以下凭证。

Mozilla/5.0 (compatible; vuhuvBot/1.0; +http://vuhuv.com/bot.html)

robots.txt支持

vuhuv机器人符合http://www.robotstxt.org/robotstxt.html 中规定的标准,并使用vuhuvbot ID。

User-agent: vuhuvbot

使用Html标签

vuhuvbot会考虑到放置在页面中的一些html标签,并进行相应的处理。以下是vuhuvbot考虑到的例子。

  • <title>页面链接</title>从标题标签中获取页面标题。
  • <meta name=”keywords” content=”…” />从元关键字标签中获取页面内容的关键字。
  • <meta name=”Description” content=”…” /> 从元描述标签中获取相关页面的摘要。
  • <meta http-equiv=”Content-Type” content=”type; charset=…” />从charset部分获得页面的字符编码。
  • <meta http-equiv=”refresh” content=”5;url=directed-page.html” /> vuhuvbot检测页面上的元重定向并检索相关地址。
  • <meta name=”robots” content=”index, follow” /> vuhuvbot在用meta robots指定相关页面是否应该包含在搜索索引中时,会考虑到这一点。
  • 在<a href=”…html” rel=”nofollow”>示例</a>页面中,vuhuvbot会识别写在href中的rel=”nofollow “参数,即不希望采取的地址,而不采取相关地址。

常见问题

FAQs
查看更多 >