Archive.is

archive.today
Archive.is-Screenshot.png
archive.today网站截图
网站类型
网站典藏
语言 多语言
网址
注册
推出时间 2012年5月16日,​10年前[2][3]
现状 活跃

archive.today又称archive.is,是一个私人资助的网页存档网站,资料中心位于欧洲法国的北部-加来海峡。这个网站典藏档案馆使用Apache HadoopApache Accumulo软体。它可以一次取回一个类似于WebCite的小于50MB的页面,并能收录Google地图Twitter

archive.is会根据著作权所有者的合乎数位千年著作权法案(DMCA)的撤除请求移除已存档的页面。[7]

它每次请求都会撷取网页的文字内容,载入不含活动元素或指令码的Web 2.0网站或由JavaScript产生的图片与框架内容。 截图是1024×768像素,没有快显画面。[8][9]

截至2015年,archive.is还支援了Memento ProjectAPI[10][11]并且开发了Firefox浏览器[12]与Chrome浏览器[13]扩充功能

封锁

在2015年7月21日,网站管理人员封锁了芬兰的IP位址,他们在其Twitter上声称,这么做是为了避免与芬兰政府的纠纷升级。他们拒绝提供额外的资讯。[14]此网站也被中国[15]哈萨克斯坦封锁。此站同样被OpenDNS封锁。[16]

易名

archive.is曾多次更换网域名称。

从建站初期至2014年4月14日是使用「Archive.is」(首字母为大写)。

在2014年4月15日时,该网站的名称已更名为「archive.today」(首字母为小写)。[17][18]

在2015年春季又改回了「archive.is」(首字母为小写)。[19][20]

2021年夏季,此网站采用「archive.today」为标题,主域名替换为「archive.ph」。

使用案例

这个档案馆会被一些作者或骇客活动分子使用。

  • 有些线上使用者(例如玩家门成员)使用它检视他们反对的网站的内容以避免向其贡献网站流量[21]
  • 朱利安·阿桑奇《当Google遇上维基解密》(When Google Met WikiLeaks)的一书中[22]使用了archive.is保留线上引文。[23]
  • 叙利亚电子军为了证明他们入侵网站而使用它。[24]

评论

有别于比如网际网路档案馆时光机Internet Archive Wayback Machine)的主动性网路蜘蛛,archive.is每次只撷取网站的一个页面,所以不遵守「Robots排除标准」。 [25]

从法律上讲,archive.today与网际网路档案馆时光机有很大不同。网际网路档案馆的时光机抓取网页时遵循通常的Robots指令,这种指令可以阻止其抓取特定的网页。然而,网站无法阻止archive.today的使用者对其制作站点镜像。

参见

参考文献

  1. ^ Will you make a v3 onion site for Archive Today?. blog.archive.today. 2021-07-13. 
  2. ^ Archive.is blog — When did the Archive-is site originally launch?
  3. ^ Archive.is — Викиреальность
  4. ^ pseric. Archive.is 线上备份网页工具,可下载完整网页内容或将画面转为撷图. Free.co.tw. 2015-06-27 [2015-07-26]. (原始内容存档于2015-06-27). 
  5. ^ Martin Brinkmann. Create publicly available web page archives with archive.is. GHacks. 2015-04-22 [2015-06-13]. (原始内容存档于2015-10-12). 
  6. ^ archive.is status. Stat Radar. [2013-05-08]. (原始内容存档于2013-07-27). 
  7. ^ "How can I delete an archived page?". [2015-07-17]. (原始内容存档于2015-07-21). 
  8. ^ archive.today – webpage capture. archive.today. [2013-05-08]. (原始内容存档于2012-06-28). 
  9. ^ archive.today FAQ. archive.today. [2013-05-08]. (原始内容存档于2013-04-20). 
  10. ^ Nelson, Michael L. Archive.is Supports Memento. Research and Teaching Updates. Web Science and Digital Libraries Research Group at Old Dominion University. 2013-07-09 [2013-09-17]. (原始内容存档于2013-07-27). 
  11. ^ "archive.is"页面存档备份,存于网际网路档案馆Memento Protocol Information. Memento Development Group. Retrieved 17 September 2013.
  12. ^ Archiveror – Get this Extension for 🦊 Firefox (en-US). addons.mozilla.org. [2019-06-29]. (原始内容存档于2019-06-25). 
  13. ^ archive.today Button. chrome.google.com. [2019-06-29]. (原始内容存档于2019-06-29). 
  14. ^ archive.today. @FukBoyKuupe @atlasnodded I blocked proactively in order not to escalate as in recent Russia vs. http://archive.org  case.. 2015-07-21 [2015-07-22]. (原始内容存档于2015-10-21). 
  15. ^ archive.is is 100% blocked in China. GreatFire Analyzer. 12 August 2018. (原始内容存档于12 August 2018). 
  16. ^ Jared. Even my school blocks http://archive.today , what the hell. 2015-07-24 [2019-06-29]. (原始内容存档于2018-12-28). 
  17. ^ archive.is - webpage capture - Google 2014年4月14日 11:21:06 GMT (Peeep.usのキャッシュ页面存档备份,存于网际网路档案馆))
  18. ^ archive.today - webpage capture - Google 2014年4月18日 17:40:45 GMT (Peeep.usのキャッシュ页面存档备份,存于网际网路档案馆))
  19. ^ https://archive.today:443/ - 2015年3月22日 22:49 - ウェブ鱼拓. megalodon.jp. [2015年7月19日]. (原始内容存档于2015年6月28日). 
  20. ^ https://archive.is:443/ - 2015年5月14日 01:08 - ウェブ鱼拓. megalodon.jp. [2015年7月19日]. (原始内容存档于2015年6月28日). 
  21. ^ Koebler, Jason. Dear GamerGate: Please Stop Stealing Our Shit. 2014-10-29 [2019-06-29]. (原始内容存档于2019-06-29). 
  22. ^ Julian Assange - When Google Met WikiLeaks. [2015-07-17]. (原始内容存档于2015-07-21). 
  23. ^ user, Debian. Julian Assange - Google Is Not What It Seems. 2014-10-24 [2015-07-17]. (原始内容存档于2016-01-14). 
  24. ^ US Army Official Website Hacked — Syrian Electronic Army. 2015-06-14 [2015-07-17]. (原始内容存档于2015-06-11). 
  25. ^ Dascalescu, Dan. Web page archiving - Dan Dascalescu's Wiki (review). Wiki.dandascalescu.com. 2013-02-18 [2013-10-03]. (原始内容存档于2015-10-12). 

外部连结