Wayback stroj

Z Wikipédie, voľnej encyklopédie
Prejsť na navigáciu Prejsť na vyhľadávanie
Wayback stroj
Wayback stroj
Obrázok loga
URL archive.org/web/ (anglicky)
Typ lokality archív
jazyky) Angličtina
Programovací jazyk Java , Python
vlastník Internetový archív
Začiatok práce 24. október 2001
Rebríček Alexa 205[1]

Wayback Machine (od Angličanov. - "Time Machine") - bezplatná on-line archív nezisková knižníc " Internetového archívu ". Pomocou vyhľadávacích robotov alebo webových prehľadávačov Wayback Machine archivuje a sprístupňuje verejnosti väčšinu „otvoreného“ internetu[2] . Služba bola spustená v roku 1996, no verejnosti sa sprístupnila až v roku 2001. Počas prvých 20 rokov existencie Wayback Machine katalogizoval a zachoval zbierku viac ako 286 miliárd webových stránok. Archivované snímky sú zobrazené vo formáte HTML , JavaScript a CSS[3] . Vďaka dokumentom uloženým vo Wayback Machine môžu používatelia sledovať zmeny vyskytujúce sa na stránkach a porovnávať rôzne verzie úprav [4] . Od júla 2021 poskytoval Wayback Machine prístup k viac ako 591 miliardám uložených webových stránok [5] .

Tvorba

Internetové archívne servery, 2008
Brewster Cale v roku 2009

V roku 1989 anglický vedec Tim Berners-Lee vytvoril World Wide Web , systém, ktorý umožňuje prenos údajov prostredníctvom počítačov pripojených k internetu. S rozširovaním World Wide Web však boli identifikované dva hlavné problémy. Prvým bol nedostatok miesta na uloženie všetkých údajov, čo spôsobilo vymazanie mnohých dokumentov a webových stránok. Ďalším problémom bolo, že po úprave webovej stránky (napríklad z právnych dôvodov) sa používateľom nepodarilo zobraziť jej pôvodnú verziu. Na vyriešenie týchto nevýhod sa snažila Americká digitálna knižnica " Internet Archive " - nezisková organizácia, ktorú vytvorili programátori Brewster Kahle a Bruce Galliate [en] v roku 1996. V spolupráci s Alexa Internet , dcérskou spoločnosťou Amazonu pre indexovanie webu, Archive inicioval vytváranie a ukladanie kópií existujúcich stránok s cieľom vytvoriť „univerzálny prístup k vedomostiam“. Organizácia poskytla bezplatný verejný prístup k digitalizovaným materiálom, ako sú webové stránky, knihy, zvukové nahrávky vrátane živých koncertov, videá, obrázky a softvér. Pre rok 2021 sa sídlo internetového archívu nachádza v San Franciscu , v bývalom kresťanskom kostole v oblasti Richmond . Novinár miestnej rozhlasovej stanice Kawl [en] v roku 2019 prirovnal kanceláriu Archívu k rímskemu chrámu [6][7] [8] . Cieľom organizácie je zachrániť internet pred zánikom[9] .

The Wayback Machine sa stal najznámejším projektom Archívu. Online služba bola pomenovaná po stroji času z animovaného seriálu The Rocky and Bullwinkle Show zo 60. rokov minulého storočia. Poskytuje prístup k digitálnej zbierke približne 562 miliárd webových stránok [4] [10] [11] . Projekt Wayback Machine bol koncipovaný ako riešenie chyby 404 , čo znamená, že server nemôže nájsť údaje na požadovanej adrese. Môže za to takzvaný zánik odkazov – rastúca nedostupnosť raz zverejnených údajov. Napríklad v roku 1997 bola priemerná životnosť webovej stránky 44 dní. V roku 2003 to bolo 100 dní. Analýza odkazov na 2 700 digitálnych zdrojov z roku 2008, z ktorých väčšina nemala ekvivalent tlače, zistila, že približne 8 percent odkazov prestalo fungovať po roku. Do roku 2011, po troch rokoch, bolo 30 percent odkazov v zbierke mŕtvych [12] . Vďaka integrácii Alexa môže používateľ, ktorý čelí chybovej správe, získať prístup k archivovanej verzii stránky prostredníctvom vstavaného panela s nástrojmi prehliadača. Ak by sa v databáze Wayback Machine nachádzala kópia neprístupnej stránky, rozsvietilo by sa špeciálne tlačidlo. V tomto prípade mohli používatelia dať prehliadaču povolenie na prezeranie a registráciu aktivity – v tomto prípade boli všetky navštívené stránky archivované na portáli [13] .

Wayback Machine bol spustený v máji 1996, no verejnosti sa sprístupnil až v roku 2001 – predtým boli všetky informácie zaznamenané na digitálnych magnetických páskach prístupné len obmedzenému počtu vedcov a výskumníkov [14] . V čase „otvorenia“ archív obsahoval viac ako 10 miliárd archivovaných stránok [4] . Do decembra 2014 Wayback Machine oznámil, že ušetril 435 miliárd webových stránok po celom svete[2] . Technicky vzaté, softvér Wayback Machine nie je archív, ale skôr verejné rozhranie pre obmedzenú podmnožinu všetkých repozitárov [15] . Wayback Machine teda nemožno považovať za vyhľadávací nástroj zbierky organizácie, keďže nevyhľadáva databázu inej veľkej virtuálnej knižnice – Open Library , ktorá používateľom umožňuje prístup k bezplatným digitálnym kópiám kníh, ktoré sú stiahnuté a archivované v rámci projekt [16] [17 ] .

Charakteristický

So spustením Wayback Machine sa Internet Archive stal jedným z najpopulárnejších a najznámejších online portálov a hlavnou službou archivácie webu [4][9] . V roku 1999 začal Archív rozširovať zbierku nad rámec archívneho webového obsahu, aby poskytoval status digitalizovaným aj natívne digitálnym zdrojom vrátane kníh, zvuku, filmov, obrázkov, dokumentov, softvéru a videohier[7]. Niektoré kontroly vykonávajú prehľadávače samotného archívu, zatiaľ čo iné vykonávajú partnerské organizácie. Jednotlivé databázy je možné získať prostredníctvom užívateľských darov a cielených akvizícií [17] . Samotní zakladatelia organizácie porovnávali svoju zbierku s Alexandrijskou knižnicou[7] . Od roku 2021 obsahoval Wayback Machine viac ako 424 miliárd webových stránok [15] – viac ako dokumenty v Kongresovej knižnici [18][7] [17] .

Princíp činnosti

Platforma Wayback Machine funguje na dvoch hlavných prvkoch – vyhľadávacích robotoch (alebo webových prehľadávačoch ) a rozhraní. Webové prehľadávače navštevujú, extrahujú, sťahujú a archivujú webové stránky. Cez rozhranie zase užívatelia získajú prístup k online zbierkam[3] .

Vyhľadávacie roboty

Rast kolekcie Wayback Machine Collection [19]
Kolekcia Wayback Machine podľa roku Archivované stránky (v miliardách)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452
2020
514
2021
581

Spočiatku, archívne zbierka bola doplnená prehliadača plug-in od Alexa Internet, ktorý automaticky zachytí a uloží každú webovú stránku, pretože je navštívil, potom preneste všetky získané informácie "internetového archívu". Používatelia si tiež môžu nainštalovať bezplatný panel nástrojov na kontrolu stavu archivácie vybranej webovej lokality [17] .

V roku 2002 Archív spustil svoj vlastný vyhľadávací robotHeritrix [en] open source. Crawler kódy sú napísané pomocou kombinácie programovacích jazykov C a Perl . Internetový archív navyše akceptuje aj skenované dáta od iných darcov[7] . Naskenované kópie webových stránok sa automaticky skonvertujú na súbory s veľkosťou približne 100 MB, ktoré sa potom uložia na servery. Bežná miera dopĺňania archívu je približne 10 terabajtov za mesiac [20] .

Webové prehľadávače zachytávajú verziu stránky tak, ako bola uložená v čase, keď bola prístupná cez adresu URL. Roboty pravidelne prehľadávajú veľké množstvo webových stránok, rekurzívne načítavajú, analyzujú a zobrazujú stránky HTML , JavaScript a CSS[3] . Mechanizmus práce prehľadávačov je podobný práci vyhľadávacích nástrojov - roboty samostatne vyhľadávajú portály na archiváciu cez vyhľadávač ciest, skenujú stránky a súvisiace stránky, čím vytvárajú sieť portálov. V čase, keď bol archív vytvorený, bol celosvetový web taký malý, že webové prehľadávače mohli prehľadávať všetky stránky v jednej relácii. Neustály rast online portálov a ich volatilita však postupom času takmer znemožňovali úplne prejsť celú sieť. Nie všetky zmeny na stránkach sú teda zaznamenané v Wayback Machine[9] . Vedenie archívu nešpecifikuje, ako roboty nachádzajú a vyberajú stránky na prehľadávanie, ale uvádza, že prehľadávače sú najčastejšie nasmerované na stránky, ktoré sú prepojené z iných portálov a sú vo verejnej doméne. Prehľadávač začína na webovej stránke a potom nasleduje každý hypertextový odkaz na tejto webovej stránke, aby navigoval na nové lokality. Na každej z nových webových stránok prehľadávač zopakuje proces [15] . Bude pokračovať, kým sa archivácia nezastaví alebo nedosiahne limit stanovený skriptom [21] . Okrem toho môže každý užívateľ použiť špeciálny formulár na portáli a zavolať crawler, ktorý stránku uloží v aktuálnom stave[3] . Wayback Machine skenuje iba verejné webové stránky a nemôže pristupovať k obsahu, ktorý je chránený heslom alebo je hosťovaný na súkromnom serveri [11] [15] [4] .

Rozhranie

Rozhranie Wayback Machine umožňuje používateľom vykonávať dve hlavné akcie – prístup k histórii zmien na stránke a zobrazenie všetkých úprav vykonaných na portáloch. Dostupná je aj funkcia porovnávania rôznych verzií stránok [13] [22] [18] [23] . Ak to chcete urobiť, zadajte adresu URL portálu, ktorý vás zaujíma, do špeciálneho vyhľadávacieho poľa, po ktorom Wayback Machine zobrazí zoznam archivovaných dátumov. Hviezdička za niektorými dátumami sa používa na označenie zmien nájdených na stránke. Adresa URL archivovanej stránky začína na web.archive.org [24] [15] .

Ktokoľvek si môže uložiť adresy URL na archiváciu a pomocou bezplatného archívneho účtu môžete vytvárať a archivovať akékoľvek odchádzajúce alebo externé odkazy na pôvodnej stránke a získať prehľad [25] [25] .

Skladovanie

V roku 2018 mala zbierka Internet Archive viac ako 40 petabajtov alebo 40 miliónov gigabajtov údajov a Wayback Machine poskytoval prístup k približne 63 % všetkého dostupného materiálu [26] . K februáru 2020 Wayback Machine archivoval viac ako 900 miliárd adries URL a viac ako 400 miliárd webových stránok. [27] V júni 2021 poskytoval Wayback Machine prístup k viac ako 581 miliardám uložených webových stránok [5] .

Použitie

Portál Wayback Machine je často využívaný v právnej oblasti – právnici službu využívajú na vyhľadávanie informácií o občianskoprávnych nárokoch, trestných veciach, správnych konaniach a patentových konaniach. Archivované verzie stránok získané prostredníctvom Wayback Machine je možné použiť na vyriešenie problémov s patentovým právom alebo na uloženie sankcií za zverejnenie materiálov, ktoré boli následne odstránené zo siete[3] [13] . Napriek rozsiahlemu využívaniu zbierky Internet Archive na poskytovanie dôkazov niektoré americké súdy odmietli akceptovať snímky obrazovky webových stránok s odvolaním sa na právne ťažkosti pri identifikácii pôvodného dokumentu s archivovanou verziou [28]. V roku 2018 americký odvolací súd rozhodol, že snímky obrazovky z archivovaných webových stránok Wayback Machine sú právnym dôkazom, ktorý možno použiť v súdnom konaní. [29] [30]

Články archivované na Wayback Machine umožňujú autorom vytvoriť práva na otvorenie alebo publikovanie [31] . Pre sociológov a historikov ponúka Wayback Machine cenný rozsiahly zdroj údajov na analýzu správania spoločnosti, predajných stratégií a sociálnych praktík[2] [32] . Wayback Machine vám tiež umožňuje prístup k denníkom s otvoreným prístupom . Od začiatku 21. storočia tak z internetu zmizlo 84 časopisov OA z prírodných vied a ďalších asi 100 zo sociálnych a humanitných vied [33] [34] [35] .

Aktivisti a výskumníci využívajú portál na boj proti dezinformáciám , ktoré sa zintenzívnili najmä po zvolení prezidenta Donalda Trumpa v USA . V reakcii na narastajúce kontroverzie zo strany prezidentskej administratívy vytvorili archívy samostatnú zbierku s názvom Trump Archives, ktorá obsahuje prezidentove televízne vystúpenia a tweety . Archív dúfa, že jeho úložisko pomôže ostatným identifikovať nepravdivé informácie a skontrolovať podozrivý obsah [36] [37] . V niektorých prípadoch však jednotliví aktivisti tvrdili, že archivované zdroje Wayback Machine naopak prispeli k šíreniu dezinformácií. S nástupom pandémie koronavírusu teda priaznivci konšpiračných teórií použili snímky obrazovky uložené portálom na šírenie nepravdivých informácií o koronavíruse [38] . Ako protiopatrenie Archive v novembri 2020 implementoval overovacie nástroje do Wayback Machine. Na tento účel sa nezisková organizácia spojila s rôznymi spoločnosťami, ktoré overujú fakty, aby používateľom poskytli dôvody na odstránenie stránky zo zbierky. Keď otvoríte archivovanú verziu webovej stránky, Wayback Machine poskytne používateľom informácie o dôvode jej odstránenia vo forme žltého bannera v hornej časti obrazovky. Ak je webová stránka podozrivá zo zapojenia do dezinformačnej kampane, Wayback Machine poskytne podrobnosti o organizácii, ktorá overila platnosť, a odkaz na jej správu [39].

V niektorých prípadoch sa informácie získané prostredníctvom Wayback Machine objavili vo veľkých škandáloch. S pomocou portálu sa teda zistilo, že oficiálny predstaviteľ amerického ministerstva zdravotníctva a sociálnych služieb Michael Caputo [en] v sérii už zmazaných tweetov zverejnil rasistické a hanlivé komentáre o čínskom ľude [40] . Wayback Machine si navyše uchováva kópiu neskôr vymazanej správy, že vodca ukrajinských separatistov Igor Strelkov prevzal zodpovednosť za haváriu Boeingu 777 v Doneckej oblasti [41] [42] . V máji 2021 spoločnosť Bellingcat zistila, že americká armáda rozmiestnená v Európe používa mobilné aplikácie pre deti na ukladanie informácií na ukladanie tajných údajov. Kvôli nesprávne nastaveným nastaveniam ochrany osobných údajov získali ostatní používatelia prístup k utajovaným informáciám. Po zistení úniku informácií armáda všetky karty odstránila, no zostali v Wayback Machine [43] .

Právny stav

Internetový archív nepožaduje povolenie na kopírovanie webových stránok pred zhromažďovaním údajov na diaľku, ale na požiadanie vymaže alebo obmedzí prístup k archivovaným materiálom. Vlastníci webových stránok majú napríklad možnosť „odhlásiť sa“ z archivácie prostredníctvom štandardného súboru robots.txt, ktorý vylučuje webové stránky zo zoznamu portálov webových prehľadávačov[9] [44] . Internetový archív je však z dôvodu uchovávania iných údajov v zraniteľnom právnom postavení [45] . Napríklad v roku 2005 sa Wayback Machine zaplietol do sporu o ochrannú známku medzi Healthcare Advocates a Health Advocate. Ten použil Wayback Machine na prístup k webovým stránkam Healthcare Advocates z roku 1999 v snahe nájsť informácie, ktoré by podporili prípad. V reakcii na to Healthcare Advocates zažalovali Health Advocatt aj Archive, pričom tvrdili, že archív porušil zákon Digital Millennium Copyright Act . Následne sa prípad vyriešil mimosúdne [46] .

V roku 2002 archív odstránil zo svojho systému odkazy na archivované kópie portálu Xenu.net, ktorý vlastní cirkevný kritik Andreas Heldal-Lund. Odstránenie sa uskutočnilo na žiadosť právnikov Scientologickej cirkvi, ktorí uviedli, že vlastnia výňatky z cirkevných dokumentov zverejnených na webovej stránke [47] [48] .

Obmedzenia

Výskumníci a aktivisti kritizovali Wayback Machine a Internet Archive za to, že sa snažili zachovať všetok online materiál, z ktorých mnohé majú malú hodnotu. Podľa niektorých výskumníkov je to spôsobené zastaranou politikou internetového archívu, ktorý bol založený koncom 90. rokov - vtedy, na úsvite vytvárania internetových archívov, sa verilo, že internetové údaje by sa mali zachovať v plnom rozsahu. S vytvorením mnohých jednodňových stránok však mnoho výskumníkov a aktivistov zmenilo názor [49] . Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам [50] . Сканеры захватывают только статистический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется[9] .

Блокировки

В 2015 году Роскомнадзор принял решение заблокировать Wayback Machine за копию страницы текста «Одиночный джихад в России», содержащего информацию о «теории и практике партизанского сопротивления». Соответствующая страница в Архиве Интернета была добавлена в официальный реестр запрещенных веб-сайтов в России 23 июня 2015 года, из-за чего некоторые российские интернет-провайдеры были вынуждены полностью заблокировать сайт Архива Интернета [51] [52] [53] . В 2019 году представители Ассоциации по защите авторских прав в интернете (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили Мосгорсуд вынести решение о вечной блокировке портала на территории России, однако на август 2020 года Архив Интернета по-прежнему продолжал свою работу [54] [55] [56] [57] .

В 2017 году портал был заблокирован в Индии и Киргизии за содержание «экстремистских материалов» [58] [59] [60] . По данным на 2021 год сайт заблокирован в Китае [61] .

Примечания

  1. https://www.alexa.com/siteinfo/archive.org
  2. 1 2 3 Arora, 2015 .
  3. 1 2 3 4 5 Lerner, 2017 , с. 1741—1755.
  4. 1 2 3 4 5 Michael Bryant. What is the Wayback Machine and Why is it Useful? . Groovy Post (22 апреля 2021). Дата обращения: 29 мая 2021.
  5. 1 2 Wayback Machine . Wayback Machine. Дата обращения: 7 июня 2021.
  6. Dominic Cummings: how the internet knows when you've updated your blog . The Conversation (28 мая 2020). Дата обращения: 3 июня 2021.
  7. 1 2 3 4 5 Odgen, 2017 .
  8. In An Old Church, The Internet Archive Stores Our Digital History . Kalw. San Francisco local public radio (11 сентября 2019). Дата обращения: 3 июня 2021.
  9. 1 2 3 4 5 Price, 2011 .
  10. Jack Schofield. The Time Machine . The Guardian (19 ноября 2007). Дата обращения: 1 июня 2021.
  11. 1 2 Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress . WPMudev (25 мая 2017). Дата обращения: 29 мая 2021.
  12. Adrienne LaFrance. Raiders of the Lost Web . The Atlantic (14 октября 2015). Дата обращения: 7 июня 2021.
  13. 1 2 3 Rogers, 2017 , с. 160—172.
  14. Hartelius, 2020 , с. 378.
  15. 1 2 3 4 5 Bowyer, 2021 , с. 43—57.
  16. Aja Romano. A lawsuit is threatening the Internet Archive — but it's not as dire as you may have heard . Vox (23 января 2020). Дата обращения: 29 мая 2021.
  17. 1 2 3 4 Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web . Forbes (18 января 2016). Дата обращения: 5 июня 2021.
  18. 1 2 O'Connor, 2008 , с. 64.
  19. michelle. Wayback Machine Hits 400,000,000,000! . Internet Archive (May 9, 2014). Дата обращения: 25 марта 2015. Архивировано 26 августа 2014 года.
  20. Richard Koman. How the Wayback Machine Works . Xml.com (21 января 2002). Дата обращения: 5 июня 2021.
  21. A. Rossi. Worldwide Web Crawls . Internet Archive (5 октября 2010). Дата обращения: 5 июня 2021.
  22. Laura Bohannon. Wayback Machine archives websites for over 20 years . Spartan News Room (7 декабря 2017). Дата обращения: 5 июня 2021.
  23. Maemura, 2018 .
  24. Notess, 2002 .
  25. 1 2 Mark Graham. Tips for Using the Internet Archive's Wayback Machine in Your Next Investigation . Global Investigative Journalism Network (5 мая 2021). Дата обращения: 29 мая 2021.
  26. Zachary Crockett. Inside Wayback Machine, the internet's time capsule . The Hustle (28 сентября 2018). Дата обращения: 29 мая 2021.
  27. Евгений Делюкин. Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц . VcRu (26 февраля 2020). Дата обращения: 1 июня 2021.
  28. Eltgroth, 2009 .
  29. Kieren McCarthy. Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule . The Register (4 сентября 2018). Дата обращения: 4 июня 2021.
  30. Маргарита Сазонова. Электронные доказательства в спорах в сфере интеллектуальной собственности . Гарант (26 октября 2020). Дата обращения: 5 июня 2021.
  31. Pearce, 2009 , с. 875.
  32. Milligan, 2016 .
  33. Jeffrey Brainard. Dozens of scientific journals have vanished from the internet, and no one preserved them . Science (8 сентября 2020). Дата обращения: 1 июня 2021.
  34. Diana Kwon. More than 100 scientific journals have disappeared from the Internet . Nature (10 сентября 2020). Дата обращения: 1 июня 2021.
  35. avouner. Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил . Хабр (10 сентября 2020). Дата обращения: 5 июня 2021.
  36. Camilla Hodgson. How the Internet Archive is waging war on misinformation . Financial Times (17 сентября 2019). Дата обращения: 3 июня 2021.
  37. Mary Kay Magistad. Where to find what's disappeared online, and a whole lot more: the Internet Archive . The World (23 февраля 2017). Дата обращения: 7 июня 2021.
  38. Acker, 2020 .
  39. Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц . Trash Box (2 ноября 2020). Дата обращения: 5 июня 2021.
  40. Журналисты припомнили расистские высказывания пресс-секретаря Минздрава США . Красная весна (24 апреля 2020). Дата обращения: 5 июня 2021.
  41. Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17? . Open Culture (19 июля 2014). Дата обращения: 3 июня 2021.
  42. Jil Lepore. The Cobweb . New Yorker (19 января 2015). Дата обращения: 7 июня 2021.
  43. Дамир Камалетдинов. В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях . T Journal (30 мая 2021). Дата обращения: 5 июня 2021.
  44. Carolyn Wimbly Martin. Internet Archive's Open Library and Copyright Law . Lutzker (15 мая 2020). Дата обращения: 4 июня 2021.
  45. Nate Anderson. Copy some webpages, owe more than the national debt . Ars Technica (1 мая 2011). Дата обращения: 5 июня 2021.
  46. Eric Bangeman. Internet Archive settles suit over Wayback Machine . Ars Technica (31 августа 2006). Дата обращения: 7 июня 2021.
  47. Lisa M. Bowman. Net archive silences Scientology critic . C Net (24 сентября 2002). Дата обращения: 10 июня 2021.
  48. Ernest Miller. Features: Sherman, Set the Wayback Machine for Scientology . LawMeme (24 сентября 2002). Дата обращения: 10 июня 2021.
  49. Nora Caplan-Bricker. Preservation Acts . Harper's Magazine (декабрь 2018). Дата обращения: 2 июня 2021.
  50. Crudo, 2014 .
  51. Mike Masnick. Russia Blocks The Internet Archive's Wayback Machine Over A Single Page . Tech dirt (26 июня 2015). Дата обращения: 3 июня 2021.
  52. Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада" . Московский комсомолец (25 июня 2015). Дата обращения: 5 июня 2021.
  53. Роскомнадзор заблокировал страницу «архива интернета» за экстремизм . Lenta (25 июня 2015). Дата обращения: 5 июня 2021.
  54. АЗАПИ хочет навечно заблокировать «Архив интернета» . Роскомсвобода (22 августа 2019). Дата обращения: 5 июня 2021.
  55. «Архив интернета» могут навечно заблокировать в России . C News (23 августа 2019). Дата обращения: 7 июня 2021.
  56. Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru . C News (19 августа 2020). Дата обращения: 7 июня 2021.
  57. Американские издатели книг подали в суд на Internet Archive . Ведомости (2 июня 2020). Дата обращения: 5 июня 2021.
  58. Access to Internet Archive's Wayback Machine Blocked in India . The Wire (8 августа 2017). Дата обращения: 3 июня 2021.
  59. Wayback Machine has been blocked in India . The Verge (9 августа 2017). Дата обращения: 5 июня 2021.
  60. Kyrgyzstan Blocks Archive.org on 'Extremism' Grounds . Global Voices. Дата обращения: 5 июня 2021.
  61. Anna Kramer. The internet is splitting apart. The Internet Archive wants to save it all forever . Protocol (10 марта 2021). Дата обращения: 9 июня 2021.

Литература

  • Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics. // Harvard Kennedy School (HKS) Misinformation Review. — 2020. — doi : 10.37016/mr-2020-41 .
  • Anat Ben-David, Adam Amram. The Internet Archive and the socio-technical construction of historical facts // Internet Histories. — 2018. — doi : 10.1080/24701475.2018.1455412 .
  • Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource. — 2015. — Т. 67 , вып. 8 . — С. 1904—1915 . — doi : 10.1002/asi.23503 .
  • Bowyer S. The Wayback Machine: notes on a re‑enchantment // Archival Science. — 2021. — Т. 21 . — С. 43—57 .
  • Deborah R. Eltgroth. Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence // Fordham L. Rev.. — 2009. — Т. 78 , вып. 181 .
  • Greg R. Notess. The Wayback Machine: The Web's Archive // Online. — 2002. — Т. 26 , вып. 2 .
  • Hartelius J. The anxious flâneur: Digital archiving and the Wayback Machine // Quarterly Journal of Speech. — 2020. — Т. 106 , вып. 4 . — С. 377—398 .
  • James L. Quarles III and Richard A. Crudo. [Way]Back to the Future: Using the Wayback Machine in Patent Litigation // Landslide. — 2014. — Т. 6 , вып. 3 .
  • Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present // Association for Computing Machinery. — 2017. — doi : 10.1145/3133956.3134042 .
  • Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance // Journal of the association for information science and technology. — 2018. — Т. 69 , вып. 10 . — С. 1223—1233 .
  • Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives // International Journal of Humanities and Arts Computing. — 2016.
  • Murphy J., Hashim N., O'Connor P. Take Me Back: Validating the Wayback Machine // Journal of Computer-Mediated Communication. — 2008. — Вып. 13 . — С. 60—75 .
  • Odgen J., Halford S., Carr L. Observing Web Archives // WebSci. — 2017. — С. 299—308 .
  • Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org) // Medical Hypothesis. — 2009. — С. 875 .
  • Price. Internet Archiving – The Wayback machine // MLA Commons. — 2011.
  • Phyllis Holman Weisbard. Oldies but Goodies: Archiving WebBased Information // Feminist Collections. — 2011. — Т. 32 , вып. 2 .
  • Rogers R. Doing Web history with the Internet Archive: screencast documentaries // Internet Histories. — 2017. — Т. 1 , вып. 1—2 . — С. 160—172 . — doi : 10.1080/24701475.2017.1307542 .