htrix

htrix蜘蛛/爬蟲屬於其他型別,由Web@rchiv Österreich開發執行。您可以繼續閱讀下方資訊,以深入瞭解htrix基本資訊,使用者代理和訪問控制等。

基本資訊

htrix的基本資訊如下表。但部分不是很規範的蜘蛛和爬蟲,可能存在資訊不明的情況。
蜘蛛/爬蟲名稱
htrix
型別
其他
開發商
Web@rchiv Österreich
當前狀態
活動

使用者代理

關於htrix蜘蛛或者爬蟲的使用者代理字串,IP地址和伺服器,所在地等資訊如下表格所示:
htrix/1.14.4
使用者代理字串
Mozilla/5.0 (compatible; htrix/1.14.4 ++https://webarchiv.onb.ac.at/robot.html)
首次出現
2015-06-10 03:17:59
最後出現
2015-06-10 03:17:59
遵循robots.txt
未知
來源
IP地址(1) 伺服器名稱 所屬國家
193.170.112.167 webcrawler17.onb.ac.at AT

訪問控制

瞭解如何控制htrix訪問許可權,避免htrix抓取行為不當。

是否攔截htrix?

對於未知蜘蛛或者爬蟲。它的用途對網站來說可能是好的,也可能是壞的,這取決於它是什麼。所以說,這需要站長進一步分析判斷這些尚不明確的爬蟲行為,再作最終決定。 但,根據以往的經驗,未宣告行為目的及未命名的蜘蛛爬蟲,通常都有不可告人的祕密,我們理應對其行為進行控制,比如攔截。

通過Robots.txt攔截

您可以通過在網站的 robots.txt 中設定使用者代理訪問規則來遮蔽 htrix 或限制其訪問許可權。我們建議安裝 Spider Analyser 外掛,以檢查它是否真正遵循這些規則。

Plain text
Copy to clipboard
Open code in new window
EnlighterJS 3 Syntax Highlighter
# robots.txt
# 下列程式碼一般情況可以攔截該代理
User-agent: htrix
Disallow: /
# robots.txt # 下列程式碼一般情況可以攔截該代理 User-agent: htrix Disallow: /
	# robots.txt
	# 下列程式碼一般情況可以攔截該代理
	
	User-agent: htrix
	Disallow: /

您無需手動執行此操作,可通過我們的 Wordpress 外掛 Spider Analyser 來攔截不必要的蜘蛛或者爬蟲。

更多資訊

一般

“網路媒體的交付義務 “到底是什麼意思?我必須做什麼,允許或避免做什麼?

提供線上媒體的義務意味著,奧地利國家圖書館一方面有權對.at域名(或其他域名,如果網頁內容與奧地利有關)下的媒體內容進行一般的自動收集(收穫),每年最多四次;另一方面,根據2009年3月1日生效的《媒體法》修正案(《媒體法》第43b條),對個別定期電子媒體(網站、電子期刊、電子書等)進行有針對性的收集。只有在後一種情況下,媒體所有者才有義務根據具體情況進行合作,即在奧地利國家圖書館提出要求時,媒體所有者必須提供資料。
原則上,媒體內容是通過採集的方式收集的,為此不需要媒體所有者的任何步驟。如果採集不可行,可以規定由奧地利國家圖書館在個別情況下進行採集,或者通過媒體所有者和奧地利國家圖書館雙方都認為最合適的另一種傳輸途徑進行資料傳輸。

資料是如何收集的?

大部分資料由ÖNB提供收集(例如通過收穫,見網路歸檔),必要時通過交付(=通過標準介面傳輸資料)。

奧地利國家圖書館計劃收集哪些產品和產品型別?

完全由數字製作的媒體,也就是說,ÖNB不會多次收集相同的內容。如果一種媒介已經以印刷或離線形式交付,則不必再次交付線上版本。

純網路媒體:電子出版物:電子期刊、電子百科全書、電子圖書、電子印刷品、網上日報、網站等。

半出版的檔案:如電子學位論文。

未以印刷品發表,但與科學相關並以數字形式引用的材料:例如,科學家或研究專案網站上的研究論文、預印本、報告等。

一般來說,不收集和歸檔的資源,其內容主要是以下之一:目錄(連結列表)、討論列表、新聞組等,應用程式(軟體)、遊戲、事件日曆和廣告。

要收集電子書、電子期刊、XML資料庫和其他資料庫中的哪些文字、影象、聲音、視訊檔案?

ÖNB的重點是文字和影象材料,以延續以前的收集任務。因此,ÖNB不會,例如,從音訊平臺或影象機構收集內容,但如果,例如,一本電子書包含音訊檔案或影象,該電子書應該被完整地歸檔。

ÖNB是如何處理線上申請的?

重點是各自的內容,應用程式本身沒有被收集。如果不可能將內容與應用分開,則在此階段不能收集媒介。

網路歸檔

為什麼要進行網路歸檔?

全世界產生的資訊中,有越來越大的部分是數字的。記憶機構–即檔案館、圖書館、博物館和相關機構–其任務是收集、歸檔和提供我們的文化遺產,同時也面臨著為未來保護這些數字知識的挑戰。奧地利國家圖書館通過其網路歸檔專案,正在追求收集和歸檔 “奧地利網際網路 “的目標。

網路歸檔的策略?

通過域名採集(頂級域名.at,以及其他與奧地利有關的頂級域名,如com、.net、.org、.info、.cc、.eu等)、選擇性採集(經常變化的網頁,如媒體、當局、科學等)和事件採集(特殊場合和重大事件的線上內容,如國民議會選舉)等策略的結合,目的是為奧地利的網路空間建立最有意義的快照。媒介、當局、科學等)和事件收穫(特殊場合和重大事件的線上內容,如國民議會選舉)旨在建立儘可能有意義的奧地利網路空間的快照,並將其記錄下來供後人參考。

網路歸檔是如何進行的?使用的是什麼軟體?

在採集方面,ÖNB使用NetarchiveSuite軟體包(http://netarchive.dk/index-en.php),該軟體包由丹麥皇家圖書館和國家圖書館開發,是丹麥網路歸檔專案的一部分。以類似於網路瀏覽器的方式向主機請求資料。該軟體跟蹤網頁內的連結並收集所有發現的檔案。資料庫生成的頁面可以被收集,但不能收集受密碼保護的頁面。只使用開放原始碼軟體。通過Wayback Machine訪問。

奧地利國家圖書館是否允許對我的網站進行存檔?

奧地利國家圖書館有法律授權(媒體法)對奧地利的網路空間進行存檔,因此有權對帶有.at域名的網頁以及與奧地利有關的網頁進行存檔。

我必須為我的網站準備網路存檔嗎?我是否有必要採取任何步驟?

媒體所有者不需要為網路歸檔做任何準備。

ÖNB計劃每隔多久收集一次資料?

域名抓取(整個.at域名以及與奧地利有關的網頁)每2年進行一次。對於選擇性的和事件性的收割,根據事件、媒介等確定合適的間隔時間。

網路檔案是否會被用於商業用途?

奧地利國家圖書館的網路檔案為科學目的服務,不作商業用途。讀者可以在ÖNB的辦公場所和授權的圖書館內免費獲得該書。

我的使用者會不會把存檔版本與我網站的當前版本混淆?

我們認為,不存在混淆的危險。只有在ÖNB的辦公場所才可以訪問這些網頁,而不是通過網際網路。歸檔頁將被清楚地標明為歸檔頁。ÖNB的網路檔案不被谷歌等搜尋引擎收錄,所以搜尋引擎的使用者永遠不可能被推薦到網站的檔案版本。網路檔案的使用者將受益於 “實時 “網頁上不再有的材料。

我的網站有一個受密碼保護的區域–這也會被存檔嗎?

受訪問保護的區域只有在以下情況下才會被歸檔,例如,它是一個需要付費的區域(出版產品),但原則上是為公眾服務的。例如,內聯網或受私人訪問保護的資料不會被歸檔。

奧地利國家圖書館從哪裡獲得有關域名的資訊?

.at域名的清單是由奧地利域名序號產生器構nic.at提供給ÖNB的。具有通用頂級域名的網頁是通過手工或特殊程式獲得的。

我正在設計一個新的網站 – 我可以註冊存檔嗎?

歡迎你把你的網址發給我們。如果它符合我們的收集標準,我們會很高興地將該頁面納入採編範圍。納入的最終決定權在ÖNB。

這是否意味著ÖNB將託管我的網站?

不,網站運營商仍然負責自己的網站託管。

為什麼Robots.txt和元標籤機器人會被爬蟲忽略?

奧地利國家圖書館將網路歸檔作為其法定任務的一部分,必須優先考慮。

爬蟲會給我的伺服器帶來多大的負荷?

ÖNB的網路爬蟲是以這樣一種方式配置的,即你的伺服器負載儘可能地保持低。然而,如果由於網路採集而出現技術問題,請與我們聯絡(webarchiv@onb.ac.at,見爬蟲簽名中的資訊)。

報紙的網路存在的特點是,它們與外部網站有很強的連結,尤其是在向使用者傳送個性化廣告資訊的廣告內容方面。歸檔是否也應包括這些外部內容?

外部內容不被收集。

誰來選擇這些地點?

網頁的選擇是由所謂的網路策展人根據收集政策進行的。

與archive.org有什麼區別?

網際網路檔案館是一個非營利組織,1996年在美國成立,目的是為研究人員提供對歷史數字收藏的訪問。奧地利國家圖書館網路檔案館根據《奧地利媒體法》,專門收集帶有.at域名或奧地利參考的內容。

我怎樣才能訪問存檔的資料?

在奧地利國家圖書館,有專門的終端機可以使用,適應法律要求(例如,不能使用電子郵件等)。由於法律原因,只有在奧地利國家圖書館所在地和經授權的圖書館才可以訪問網路檔案。

交付

誰承擔建立介面的費用?

與媒體所有者一起,確定最有利和最有效的資料傳輸形式。將使用網路採集或通過現有的標準介面(如http、(S)FTP)進行資料傳輸。如果有必要為資料傳輸建立一個介面,其費用超過250歐元,媒體所有者必須通知奧地利國家圖書館這一點。如果ÖNB重複提出交付要求,它將承擔超過這一數額的費用份額。

出於安全考慮,我不同意線上交付;ÖNB是否願意定期收集資料?

也可以在DVD上離線傳輸資料。對於DVD來說,傳統的郵政途徑已經被證明是成功的。奧地利國家圖書館的收集工作只能在網上進行。

我的資料庫包括幾兆位元組。我應該如何實際轉移它們?

奧地利國家圖書館將不會接管整個資料庫,而只是接管內容。在 “一次 “幾TB的情況下,只有連續的線上傳輸才會出現問題。

哪些交付過程可以在ÖNB方面實現自動化?

一切可以通過帶有時間戳的標準化介面自動進行的工作,如收穫、下載、FTP。對ÖNB來說,大量資料的自動交付也是至關重要的。

我訂閱的期刊提前出版了電子版(”線上首發”)–對哪種媒介的投遞是強制性的?

主要是針對印刷媒體。

我的印刷期刊附有一個網站,上面有純粹的營銷內容(目錄摘錄、訂購選項等)。是否有義務為網站提供服務?

沒有。

我的印刷期刊有一個基於網路的論壇(無論是否有主持人),是否有義務提供?

沒有。

我的網路應用是支援資料庫的;如果沒有使用者介面,就不能以有意義的方式讀取資料記錄。是否有義務交付?

如果不申請就無法閱讀記錄,就沒有義務交付。如果內容在沒有應用程式的情況下是可讀的,則只收集內容。

法律

我的網站是收費的,因此有密碼保護。我必須通知奧地利國家圖書館這個密碼嗎?它是否會把它傳給別人?到國家圖書館?對使用者而言?

如果奧地利國家圖書館可以下載或收穫資料,並且該網站有密碼保護,則奧地利國家圖書館需要密碼以獲取資料。當然,奧地利國家圖書館不會將密碼傳給其他圖書館或使用者。

我可以為我的資料規定一個封鎖期嗎?

對於個別媒體,受特殊條件限制,最長為一年。然而,這必須有書面的理由。封鎖期不應該是規則。

我有撤銷權嗎?

不,儲存在檔案中的資料不會被刪除。如果法院決定撤銷資料(類似於印刷部門),奧地利國家圖書館一般會阻止該媒介的任何使用。

如果我在向奧地利國家圖書館交付個別(部分)稿件後,由於法律上的考慮,再次將其從網上刪除,怎麼辦?然而,它們是否仍將永遠儲存在奧地利國家圖書館,供使用者使用?

這個問題的處理方式與印刷作品的規定類似。原則上,貢獻會被歸檔並供人使用。只有根據法院命令或有充分理由懷疑是刑事犯罪的情況下,才不允許使用收藏品。奧地利國家圖書館沒有義務對此進行核實;特別是,它沒有義務審查贊成或反對使用某項物品的法律論據的有效性。

注:在奧地利國家圖書館,因涉嫌刑事犯罪而阻止使用的做法被限制性地處理,幾乎只適用於修正主義文獻。僅僅是作者的 “改變了的信念”(例如,提及明顯更好的新版本)並不足以阻止訪問(在上述例子中,兩個版本都可以使用)。

如何尊重版權和相關權利,在此採取了哪些保護措施?

奧地利國家圖書館只在其所在地和授權的圖書館提供所交付的媒體內容。在某些電子期刊媒體的情況下,使用是在現場單個併發使用者的意義上進行的(在同一時間只有一個相關圖書館的使用者)。不能以電子方式複製媒體內容;可以進行列印。

我的線上內容的伺服器位於德國。哪裡有交付的義務?

通常,《媒體法》規定的義務方是媒體所有者,據此,媒體所有者的註冊辦事處對交付義務具有決定性意義。伺服器實際位於何處並不重要。因此,交付的義務應適用於其註冊辦事處在奧地利的媒體所有者。

我的線上編輯對任何輔助權利的利用都有合同上的同意權。強制交付是這樣一種附屬權利的利用嗎?

不,履行媒體法規定的提供或交付義務,既不是附屬權利,也不是利用,更不是對附屬權利的利用。對附屬權利的利用是指,例如,將文字稿件設定為廣播劇,或將表演設定為戲劇,但在任何情況下都不是媒體所有者履行法律義務。使法律義務的履行取決於個人同意的合同義務也顯然是非法的,在任何情況下都是無效的。

我的線上申請是多媒體的;但是,我不被允許對照片和電影權利進行分許可。

一般來說,合同協議不能使法律義務 “無效”。然而,由於強制交付無論如何都不是內容方面的分許可,這樣的合同性分許可禁令似乎並不存在問題。

如果適用的話,出版商是否會因線上存檔的轉移而獲得賠償和無害?

不,奧地利國家圖書館在其法律基礎框架內履行其任務;關於其責任,適用一般責任和賠償規則。

媒體法程式的法律問題(如反陳述)是如何解決的?

在提供線上產品的法定義務框架內,奧地利國家圖書館必須完成歸檔和保持可用性的任務。除了對刑事犯罪的緊急懷疑或法院在這方面的命令外,奧地利國家圖書館認為它應優先遵守這一法律義務。

技術

我必須將我的資料轉換為奧地利國家圖書館的特定格式嗎?

奧地利國家圖書館支援標準格式。如果媒體所有者不可能將資料自動轉換為合適的格式,奧地利國家圖書館可以決定是否仍然要收集媒體所有者自己的格式。

奧地利國家圖書館為保證質量規定了哪些標準(程式、技術)?

奧地利國家圖書館在資料傳輸以及歸檔、資料安全和訪問等方面完全採用國際通用標準。

奧地利國家圖書館支援哪些介面?

奧地利國家圖書館支援用於資料傳輸的開放標準介面,如。http(s), (s)ftp, oai-pmh.

奧地利國家圖書館是否計劃使用專有或開放介面將內容輸入其系統?哪些人?奧地利國家圖書館是如何估計須履行交付義務的資料庫運營商的此類介面的實施工作的?

目前,奧地利國家圖書館完全依賴開放的介面,不打算在這方面引進專有介面。堅持或支援開放介面的做法到目前為止已經證明了自己。開放式介面的實施工作沒有專有介面那麼複雜;此外,開放式介面還提供了能夠將其用於其他應用的優勢。

奧地利國家圖書館的使用者可以使用哪些應用程式(郵件客戶端、網路郵件、PDF製作器等)?

在可以進入檔案系統的終端,除了用於觀看媒體的各種檢視器外,沒有向使用者提供應用程式。也不可能儲存媒體或通過電子郵件傳送。只有列印是可能的。

奧地利國家圖書館是否計劃在未來對資料庫進行整體存檔(包括資料庫應用)?在這種情況下,它是否處理資料庫的虛擬化和遷移等主題,或者是否參與相關的研究專案?

從中期來看,奧地利國家圖書館將收集和存檔內容,但不包括應用程式。然而,奧地利國家圖書館參與了長期歸檔領域的國際研究專案,其中資料庫的遷移和模擬是一個主題(如歐盟專案PLANETS)。奧地利國家圖書館(和所有其他記憶機構以及來自商業和工業的合作伙伴)意識到,這種複雜性是最大的挑戰之一,不能僅靠一個國家,更不能僅靠一個機構來應對。這一領域的解決方案只有在工業界的參與下才能在國際上合作開發。

短片序列有時可以在報紙網站上以視訊流的形式提供。這些也應該被記錄下來嗎?

沒有,除非它們是要交付的內容的一個組成部分。

是否應該訪問由個別運營商自己開發的受版權保護的編輯系統?

必須給予奧地利國家圖書館獲取內容的可能性,或將內容傳送給奧地利國家圖書館。這不可能是編輯系統本身。

常見蜘蛛/爬蟲

Common Spiders
companyspotter
companyspotter蜘蛛/爬蟲屬於其他型別,由CompanySpotter BV開發執行。您可以繼續閱讀下方資訊,以深入瞭解companyspotter基本資訊,使用者代理和訪問控制等。
DataForSeo bot
DataForSeo bot蜘蛛/爬蟲屬於其他型別,由DataForSEO OU開發執行。您可以繼續閱讀下方資訊,以深入瞭解DataForSeo bot基本資訊,使用者代理和訪問控制等。
CloudFlare crawler
CloudFlare crawler蜘蛛/爬蟲屬於其他型別,由CloudFlare, Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解CloudFlare crawler基本資訊,使用者代理和訪問控制等。
Odin
Odin蜘蛛/爬蟲屬於其他型別,由Cyble, Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Odin基本資訊,使用者代理和訪問控制等。
Chrome Privacy Preserving Prefetch Proxy
Chrome Privacy Preserving Prefetch Proxy蜘蛛/爬蟲屬於其他型別,由Google Inc.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Chrome Privacy Preserving Prefetch Proxy基本資訊,使用者代理和訪問控制等。
EFF crawler
EFF crawler蜘蛛/爬蟲屬於其他型別,由Electronic Frontier Foundation開發執行。您可以繼續閱讀下方資訊,以深入瞭解EFF crawler基本資訊,使用者代理和訪問控制等。
Modat crawler
Modat crawler蜘蛛/爬蟲屬於其他型別,由Modat B.V.開發執行。您可以繼續閱讀下方資訊,以深入瞭解Modat crawler基本資訊,使用者代理和訪問控制等。
FirmoGraph
FirmoGraph蜘蛛/爬蟲屬於其他型別,由firmograph.io開發執行。您可以繼續閱讀下方資訊,以深入瞭解FirmoGraph基本資訊,使用者代理和訪問控制等。

相關文章

Related Articles
MoCha:Meta在會說話的角色合成方面的獲得電影級飛躍精選圖片
MoCha:Meta在會說話的角色合成方面的獲得電影級飛躍
Meta 釋出了一篇研究論文,並提供了他們的新影片生成模型 MoCha(電影角色動畫生成器)的演示示例。但它如何在這個日益擁擠的領域中脫穎而出?它與 Sora、Pika 或其他當前的人工智慧影片生成模型有何不同?更重要的是,作為創作者、開發者或研究者,如何利用它為自己謀福利?我們將在本篇文章中探討這些問題。讓我們一起來解碼 Meta 的 MoCha。