Proszę o wsparcie dla Krzysia Bulczaka, największego bohatera jakiego znam.

Instytucjonalne programy archiwizacji Webu w Europie (przegląd)

Eveline Vlassenroot oraz współautorki i współautorzy artykułu Web archives as a data resource for digital scholars (International Journal of Digital Humanities, 2019) opracowali użyteczne zestawienia informacji o programach archiwizacji Webu w Europie. Programy te prowadzone są przez biblioteki i archiwa narodowe, jedynie w przypadku Portugalii mamy do czynienia z fundacją – Fundação para a Ciência e a Tecnologia, mającą jednak mocne powiązania z instytucjami państwowymi.

Opis sytuacji prawnej

Autorzy i autorki opracowania analizują sytuację prawną europejskich programów archiwizacyjnych, zwracając uwagę, że ograniczenia co do możliwości gromadzenia, przechowywania, udostępniania i używania kopii stron WWW wynikają nie tylko z przepisów prawa autorskiego. Przepisy o ochronie danych osobowych, o ponownym użyciu danych sektora publicznego czy przepisy określające standardy autentyczności kopii stron (np. w razie użycia ich jako dowodów w sprawach sądowych) wpływają na to, czy i w jaki sposób podejmuje się archiwizacji Webu. Jeśli dałoby się w tym gąszczu regulacji wskazać na podstawowe dla samego podjęcia programu archiwizacyjnego, będą nimi – jak czytamy w artykule – te dotyczące egzemplarza obowiązkowego, odpowiednio rozszerzone na domenę cyfrową. W przypadku braku takiego rozszerzenia, biblioteka czy archiwum wciąż może archiwizować strony WWW po uprzednim uzyskaniu zezwolenia od ich wydawców/właścicieli, co jednak mocno ogranicza skalę archiwizacji i jej jakość. Alternatywnie instytucje wdrażają politykę opt out:

[…] heritage institutions acting in countries that do not have legislation for the web legal deposit do not always ask the permission from the websites owners before proceeding to collect their website, preferring to take a pragmatic approach. On the one hand, they either notify the website owner of their intention to archive their website and if he/she does not object, they consider that the website owner implicitly consents to the archiving

Zestawienie strategii archiwizacyjnych

W artykule znajdziemy też przegląd strategii archiwizacyjnych, wpływających na to w jaki sposób wybierane są zasoby do archiwizacji i czy w ramach akcji archiwizacyjnych zabezpiecza się zasoby z mediów społecznościowych. Strategie te różnią się zresztą szczegółami – nawet jeśli biblioteka archiwizuje zasoby Twittera, może wprowadzać dodatkowe filtry ograniczające zasięg archiwum. Przykładowo, brytyjskie archiwum Webu zabezpiecza tweety z oficjalnych rządowych kont, ale ignoruje retweety i tweety wysyłane do tych kont z kont zwykłych użytkowników.

Plan archiwizacji zasobów mediów społecznościowych opiera się na wyborze kont, których treści będą zabezpieczane oraz relacjonowanych i komentowanych w tych przestrzeniach wydarzeń:

The social media accounts that are captured, in general focus on important people, organisations and events such as political parties, politicians, newspapers, journalists, athletes, other celebrities, etc.

W przypadku klasycznych stron WWW archiwizacja opiera się na szerokiej kwerendzie (broad crawl) i/lub archiwizacji specjalnie wyselekcjonowanych adresów. Wiedza o tym, w jaki sposób gromadzone są zasoby do archiwum jest kluczowa dla badaczy i badaczek z niego korzystających.

Metody dostępu do archiwalnych zbiorów Webu

W artykule znajdziemy także zestawienie opisujące zasady dostępu do zarchiwizowanych zbiorów Webu oraz zasady ich ponownego wykorzystania. Mamy tu do czynienia z bardzo zróżnicowanymi podejściami: od gwarantowania pełnej dostępności z prawem do swobodnego użycia w granicach prawa autorskiego po zamykanie dostępu do zbiorów na określony czas (embargo) lub udostępnianie ich wyłącznie na terminalach w siedzibie biblioteki. Niekiedy nawet w ramach dostępu przez dedykowane terminale dodatkowo ogranicza się prawa korzystania ze zbiorów poprzez blokowanie kopiowania czy wykonywania zrzutów ekranu.

Autorzy i autorki tekstu zwracają także uwagę na problem archiwizacji i udostępniania treści nielegalnych:

Since most of web archiving procedures are automatic, it is inevitable that sometimes so-called ‘illegal’ content is collected. […] If web archives contain illegal content, heritage institutions usually ensure that these archived web pages are not made accessible to the public. Nevertheless, such contents might be of interest for digital scholars and researchers in certain disciplines to understand and analyse the history and the culture of the country. To paraphrase Valérie Schafer; having, for example, access to past Neo-Nazi websites, which, in fact, contain hate speech, is of utmost importance, both for the study of digital cultures and of history in general.

Opracowanie zawiera także zestawienie metod przeszukiwania zbiorów webowych, dostępnych w ramach wybranych programów archiwizacyjnych (okazuje się na przykład, że większość archiwów pozwala na przeszukiwanie pełnotekstowe).

Osobnym problemem, sygnalizowanym w artykule, jest realne wykorzystanie archiwów Webu oraz konkurencja ze strony innych, bardziej dostępnych projektów archiwalnych. Ankietowany w ramach przygotowywania artykułu przedstawiciel British Library mówi:

Not many people are using our web archive. I think we have 100 visitors a year […] We only see this year that these kind of researchers come to our web archive because some websites are not in the Internet Archive.

W artykule znajdziemy także przegląd metod i narzędzi wykorzystywanych do archiwizacji Webu w poszczególnych instytucjach.

Artykuł Web archives as a data resource for digital scholars udowadnia, że archiwistyka Webu nie jest w Europie czymś nowym i że państwowe instytucje pamięci realizują swoje programy archiwizacyjne nieraz w ramach dostosowanego już systemu prawnego, korzystając z rozbudowanej bazy metod i narzędzi. Problemem staje się jednak upowszechnianie korzystania z udostępnianych archiwalnych zbiorów WWW.

Vlassenroot, E., Chambers, S., Di Pretoro, E. et al. Int J Digit Humanities (2019) 1: 85. https://doi.org/10.1007/s42803-019-00007-7

Przeczytaj także:

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Akceptowane są wyłącznie komentarze merytoryczne. Każdy komentarz podlega moderacji.

Udostępnij na Twitterze | Udostępnij na Facebooku