Więcej tekstów o archiwizacji Webu, historii cyfrowej i nowoczesnych instytucjach dziedzictwa? Możesz wesprzeć rozwój bloga przez wpłatę w Patronite

Archiwum Webu na czas zmiany politycznej

W tekście opublikowanym niedawno w Polityce wspominałem o inicjatywie fundacji Internet Archive, której celem było zabezpieczenie kopii stron WWW i danych instytucji federalnych. Kontekstem akcji było objęcie Białego Domu przez Donalda Trumpa. Obawiano się na przykład, że odrzucający fakty dotyczące globalnej zmiany klimatu Trump doprowadzić może – oczywiście nie bezpośrednio – do usunięcia pewnych zasobów na ten temat, dotąd publikowanych przez poszczególne agencje.

W ramach projektu End of Term Web Archive (EOT) od końca 2016 do wiosny 2017 roku zarchiwizowano ponad 200 terabajtów stron WWW i danych rządowych, przy dużym wsparciu wolontariuszy, którzy zgłosili do archiwizacji ponad 100 tys. adresów URL.

Wbrew pozorom EOT nie jest archiwum politycznie wymierzonym w Trumpa i jego administrację. Projekt powstał już w 2008 roku i zawiera też takie zasoby jak treści z kont w mediach społecznościowych prowadzonych przez Obamę lub w jego imieniu. Do tego partnerem projektu jest agencja rządowa – Biuro Publikacji Rządowych (U.S. Government Publishing Office, GPO), do którego zadań należy m.in. dbanie o stałą dostępność dokumentów publikowanych przez instytucje federalne.

Wśród 200 terabajtów zasobów zgromadzono m.in. 70 mln stron WWW i 40 mln plików PDF. Szczegółowe dane dotyczące zawartości zasobu pozyskanego na przełomie 2016 i 2017 roku znaleźć można tutaj. Wszystkie zbiory dostępne są przez wyszukiwarkę Wayback Machine.

Udostępnij na na Twitterze | Udostępnij na Facebooku

Przeczytaj także