PaperLiBot PaperLiBot

蜘蛛/爬虫名称
PaperLiBot
开发商
Finity SA
官网
finity.ai
当前状态
活动
  • PaperLiBot/2.1
  • PaperLiBot/2.1
  • PaperLiBot/2.1
  • wangling
用户代理字符串
Mozilla/5.0 (compatible; PaperLiBot/2.1; https://support.paper.li/entries/20023257-what-is-paper-li)
类型
首次出现
2018-07-13 05:58:51
最后出现
2021-03-24 13:49:22
遵循robots.txt
IP地址
20
来源
IP地址 服务器名称 所属国家
135.125.219.90 ? US
37.187.162.178 ns338306.ip-37-187-162.eu FR
37.187.162.184 ns338312.ip-37-187-162.eu FR
37.187.165.37 ns336619.ip-37-187-165.eu FR
37.187.167.33 ns339849.ip-37-187-167.eu FR
37.187.162.186 ns338314.ip-37-187-162.eu FR
37.187.162.165 ns338293.ip-37-187-162.eu FR
37.187.165.36 ns336618.ip-37-187-165.eu FR
37.187.162.191 ns338319.ip-37-187-162.eu FR
37.187.162.193 ns338321.ip-37-187-162.eu FR
用户代理字符串
Mozilla/5.0 (compatible; PaperLiBot/2.1; http://support.paper.li/entries/20023257-what-is-paper-li)
类型
首次出现
2012-05-06 21:25:00
最后出现
2018-07-17 05:38:09
遵循robots.txt
IP地址
28
来源
IP地址 服务器名称 所属国家
135.125.219.72 crawler15.paper.li DE
135.125.216.246 crawler1.paper.li FR
152.228.166.119 crawler9.paper.li FR
135.125.219.40 crawler4.paper.li FR
135.125.217.232 crawler10.paper.li FR
135.125.216.65 crawler12.paper.li FR
135.125.219.90 ? US
135.125.88.213 crawler13.paper.li FR
152.228.167.63 crawler8.paper.li FR
51.210.126.244 crawler5.paper.li FR
135.125.218.78 crawler2.paper.li DE
51.210.249.89 crawler14.paper.li FR
152.228.166.33 crawler3.paper.li FR
51.210.36.36 crawler11.paper.li FR
37.187.162.178 ns338306.ip-37-187-162.eu FR
37.187.162.184 ns338312.ip-37-187-162.eu FR
37.187.165.37 ns336619.ip-37-187-165.eu FR
37.187.167.33 ns339849.ip-37-187-167.eu FR
37.187.162.186 ns338314.ip-37-187-162.eu FR
37.187.162.165 ns338293.ip-37-187-162.eu FR
37.187.165.36 ns336618.ip-37-187-165.eu FR
37.187.162.191 ns338319.ip-37-187-162.eu FR
37.187.162.193 ns338321.ip-37-187-162.eu FR
37.187.162.183 ns338311.ip-37-187-162.eu FR
37.187.162.185 ns338313.ip-37-187-162.eu FR
37.187.162.187 ns338315.ip-37-187-162.eu FR
37.187.162.192 ns338320.ip-37-187-162.eu FR
37.187.162.126 ns335800.ip-37-187-162.eu FR
37.187.165.195 ns337541.ip-37-187-165.eu FR
51.91.136.171 crawler6.paper.li FR
37.187.165.31 ns336613.ip-37-187-165.eu FR
用户代理字符串
Mozilla/5.0 (compatible; PaperLiBot/2.1; http://support.paper.li/entries/20023257-what-is-paper-li)
类型
首次出现
2012-05-06 21:25:00
最后出现
2018-07-17 05:38:09
遵循robots.txt
IP地址
28
来源
IP地址 服务器名称 所属国家
37.187.162.183 ns338311.ip-37-187-162.eu FR
37.187.162.185 ns338313.ip-37-187-162.eu FR
37.187.162.193 ns338321.ip-37-187-162.eu FR
37.187.162.184 ns338312.ip-37-187-162.eu FR
37.187.165.31 ns336613.ip-37-187-165.eu FR
37.187.162.192 ns338320.ip-37-187-162.eu FR
37.187.162.187 ns338315.ip-37-187-162.eu FR
37.187.162.191 ns338319.ip-37-187-162.eu FR
37.187.162.178 ns338306.ip-37-187-162.eu FR
37.187.162.186 ns338314.ip-37-187-162.eu FR
用户代理字符串
wangling
类型
首次出现
2015-10-02 15:51:47
最后出现
2017-01-09 13:08:09
遵循robots.txt
IP地址
4
来源
IP地址 服务器名称 所属国家
5.135.140.29 ns2309991.ip-5-135-140.eu FR
5.135.138.175 ns2307208.ip-5-135-138.eu FR
5.135.139.138 ns2308071.ip-5-135-139.eu FR
5.135.139.114 ns2308047.ip-5-135-139.eu FR

PaperLiBot是Paper.li的网络爬虫的通用名称。

Paper.li是一项内容策划服务,让你把社会共享的内容变成美丽的在线报纸和通讯。

为什么PaperLiBot会抓取我的网站?

PaperLiBot可能因为以下原因开始抓取你的网站:

  • 您的网站在社交媒体网站上被分享或参与了。
  • 你的网站在宣传RSS订阅。
  • 一个Paper.li用户正在将你的网站的一些内容添加到他们的论文中。

我的网站内容如何被使用?

您的内容可能被包含在Paper.li的一篇或多篇论文中。这些内容可以在论文网页上看到,也可以包含在电子邮件通讯和社会宣传中(Twitter、Facebook和LinkedIn)。

当您的内容被收录时,将采取以下格式:

  • 一个指向原始内容URL(你的网站)的链接。
  • 该页的标题(在内容被抓取时)。
  • 在原始内容的URL上发现的图片缩略图。
  • 内容的简短摘要(不超过200个字符)。
  • 导致发现该内容的来源(社交媒体上的帖子、RSS feed条目、贡献者)。

关于爬虫的技术细节

当PaperLiBot爬虫访问您的网站时,它将发送一个有效的用户代理头,并从Paper.li的基础设施连接。

PaperLiBot的用户代理是:

Mozilla/5.0 (compatible; PaperLiBot/2.1; https://support.paper.li/entries/20023257-what-is-paper-li)

PaperLiBot被设计为同时在多台不同的机器上运行以提高性能和规模。因此,您的日志可能会显示来自我们基础设施内的几台机器的访问,我们的基础设施托管在OVHcloud(欧洲)和亚马逊网络服务(美国)。

PaperLiBot通常平均每几秒钟访问你的网站不超过一次。然而,由于社会媒体内容的病毒性质,有可能在短期内出现稍高的比率。

如果您想阻止PaperLiBot抓取您网站上的内容,请与Paper.li联系,以便Paper.li将您的网站添加到Paper.li的封锁名单中,并阻止未来的内容被纳入Paper.li服务中。

常见问题

FAQs
查看更多 >