DingTalkBot

DingTalkBot蜘蛛/爬虫属于类型,由Alibaba Group开发运行。您可以继续阅读下方信息,以深入了解DingTalkBot基本信息,用户代理和访问控制等。

基本信息

DingTalkBot的基本信息如下表。但部分不是很规范的蜘蛛和爬虫,可能存在信息不明的情况。
蜘蛛/爬虫名称
DingTalkBot
类型
其他
开发商
Alibaba Group
当前状态
活动

用户代理

关于DingTalkBot蜘蛛或者爬虫的用户代理字符串,IP地址和服务器,所在地等信息如下表格所示:
DingTalkBot-LinkService/1.0
用户代理字符串
DingTalkBot-LinkService/1.0 (+https://open-doc.dingtalk.com/microapp/faquestions/ftpfeu)
首次出现
2020-06-08 05:45:02
最后出现
2024-10-14 04:53:07
遵循robots.txt
未知
来源
IP地址(25) 服务器名称 所属国家
59.82.84.32 59.82.84.32 CN
59.82.84.69 59.82.84.69 CN
59.82.84.40 59.82.84.40 CN
59.82.84.91 59.82.84.91 CN
59.82.84.85 59.82.84.85 CN
59.82.61.23 59.82.61.23 CN
59.82.61.33 59.82.61.33 CN
59.82.61.61 59.82.61.61 CN
59.82.61.19 59.82.61.19 CN
59.82.61.11 59.82.61.11 CN
8.142.32.202 8.142.32.202 CN
39.103.217.225 39.103.217.225 CN
8.142.156.176 8.142.156.176 CN
8.142.47.14 8.142.47.14 CN
8.142.112.208 8.142.112.208 CN
39.98.123.102 39.98.123.102 CN
用户代理字符串
DingTalkBot-SecurityService/1.0
首次出现
2023-11-10 04:27:25
最后出现
2024-05-16 06:47:59
遵循robots.txt
未知
来源
IP地址(3) 服务器名称 所属国家
59.82.21.31 59.82.21.31 CN
59.82.83.91 59.82.83.91 CN
59.82.83.75 59.82.83.75 CN

访问控制

了解如何控制DingTalkBot访问权限,避免DingTalkBot抓取行为不当。

是否拦截DingTalkBot?

对于未知蜘蛛或者爬虫。它的用途对网站来说可能是好的,也可能是坏的,这取决于它是什么。所以说,这需要站长进一步分析判断这些尚不明确的爬虫行为,再作最终决定。 但,根据以往的经验,未声明行为目的及未命名的蜘蛛爬虫,通常都有不可告人的秘密,我们理应对其行为进行控制,比如拦截。

通过Robots.txt拦截

您可以通过在网站的 robots.txt 中设置用户代理访问规则来屏蔽 DingTalkBot 或限制其访问权限。我们建议安装 Spider Analyser 插件,以检查它是否真正遵循这些规则。

	# robots.txt
	# 下列代码一般情况可以拦截该代理
	
	User-agent: DingTalkBot
	Disallow: /

您无需手动执行此操作,可通过我们的 Wordpress 插件 Spider Analyser 来拦截不必要的蜘蛛或者爬虫。

更多信息

DingTalk Bot是阿里钉钉自定义机器人的Ruby库. 一般情况下,您很少机会在您的网站的访问日志看到DingTalkBot的足迹,除非有人在阿里钉钉分享传播您的网站内容。

官方文档:阿里钉钉自定义机器人.

安装

从rubygems中安装:

gem install dingbot

添加到Gemfile中:

gem 'dingbot'

用法

初始化客户端:

# 全局配置方式
DingBot.configure do |config|
config.endpoint = 'https://oapi.dingtalk.com/robot/send' # API endpoint URL, default: ENV['DINGTALK_API_ENDPOINT'] or https://oapi.dingtalk.com/robot/send
config.access_token = 'your access token' # access token, default: ENV['DINGTALK_ACCESS_TOKEN']
config.secret = "your sign secret" # sign secret
end
# 局部配置方式
DingBot.endpoint='https://oapi.dingtalk.com/robot/send'
DingBot.access_token = 'your access token'
DingBot.secret = "your sign secret" # sign secret

发送消息

# 快速发送一套只包含文本的Text消息(不需要构造Message对象)
def send_simple_text
DingBot.send_text('我就是我, 是不一样的烟火')
end
# 发送复杂Text消息
def send_text
message = DingBot::Message::Text.new(
'我就是我, 是不一样的烟火',
['1371xxxx117'],
false
)
DingBot.send_msg(message)
end
# 发送Link消息
def send_link
message = DingBot::Message::Link.new(
'我就是我, 是不一样的烟火',
'这个即将发布的新版本,创始人陈航(花名“无招”)称它为“红树林”。',
'https://www.dingtalk.com/',
'https://avatars1.githubusercontent.com/u/64818'
)
DingBot.send_msg(message)
end
# 发送Markdown消息
def send_markdown
DingBot.send_markdown('我就是我, 是不一样的烟火', '### 我就是我, 是不一样的烟火')
end
# 发送整体跳转ActionCard消息
def send_whole_action_card
message = DingBot::Message::WholeActionCard.new(
'乔布斯 20 年前想打造一间苹果咖啡厅,而它正是 Apple Store 的前身',
'![screenshot](@lADOpwk3K80C0M0FoA) ### 乔布斯 20 年前想打造的苹果咖啡厅',
'阅读全文',
'https://www.dingtalk.com/'
)
DingBot.send_msg(message)
end
# 发送独立跳转ActionCard类型消息
def send_independent_action_card
message = DingBot::Message::IndependentActionCard.new(
'乔布斯 20 年前想打造一间苹果咖啡厅,而它正是 Apple Store 的前身',
'![screenshot](@lADOpwk3K80C0M0FoA) ### 乔布斯 20 年前想打造的苹果咖啡厅',
[
DingBot::Message::ActionBtn.new('内容不错', 'https://www.dingtalk.com/'),
DingBot::Message::ActionBtn.new('不感兴趣', 'https://www.dingtalk.com/')
]
)
DingBot.send_msg(message)
end
# 发送FeedCard类型
def send_feed_card
message = DingBot::Message::FeedCard.new(
[
DingBot::Message::FeedCardLink.new(
'时代的火车向前开',
'https://avatars1.githubusercontent.com/u/64818',
'https://www.dingtalk.com/'
),
DingBot::Message::FeedCardLink.new(
'时代的火车向前开',
'https://avatars1.githubusercontent.com/u/64818',
'https://www.dingtalk.com/'
)
]
)
DingBot.send_msg(message)
end

更为详细的用法请见此链接:https://github.com/thierryxing/dingtalk-bot/blob/master/test/dingbot_test.rb

常见蜘蛛/爬虫

Common Spiders
DataForSeo bot
DataForSeo bot蜘蛛/爬虫属于类型,由DataForSEO OU开发运行。您可以继续阅读下方信息,以深入了解DataForSeo bot基本信息,用户代理和访问控制等。
CloudFlare crawler
CloudFlare crawler蜘蛛/爬虫属于类型,由CloudFlare, Inc.开发运行。您可以继续阅读下方信息,以深入了解CloudFlare crawler基本信息,用户代理和访问控制等。
Odin
Odin蜘蛛/爬虫属于类型,由Cyble, Inc.开发运行。您可以继续阅读下方信息,以深入了解Odin基本信息,用户代理和访问控制等。
Chrome Privacy Preserving Prefetch Proxy
Chrome Privacy Preserving Prefetch Proxy蜘蛛/爬虫属于类型,由Google Inc.开发运行。您可以继续阅读下方信息,以深入了解Chrome Privacy Preserving Prefetch Proxy基本信息,用户代理和访问控制等。
EFF crawler
EFF crawler蜘蛛/爬虫属于类型,由Electronic Frontier Foundation开发运行。您可以继续阅读下方信息,以深入了解EFF crawler基本信息,用户代理和访问控制等。
Modat crawler
Modat crawler蜘蛛/爬虫属于类型,由Modat B.V.开发运行。您可以继续阅读下方信息,以深入了解Modat crawler基本信息,用户代理和访问控制等。
FirmoGraph
FirmoGraph蜘蛛/爬虫属于类型,由firmograph.io开发运行。您可以继续阅读下方信息,以深入了解FirmoGraph基本信息,用户代理和访问控制等。
fluid
fluid蜘蛛/爬虫属于类型,由leak.info开发运行。您可以继续阅读下方信息,以深入了解fluid基本信息,用户代理和访问控制等。

相关文章

Related Articles