Zaproszenia na warsztaty: RStudio, Omeka, WordPress, praca z danymi

Dmoz.org to ważne źródło w badaniach historycznego Webu

Z kronikarskiego obowiązku warto odnotować, że niedawno zamknięty został serwis Dmoz.org (Open Directory Project), rozwijany społecznościowo katalog stron WWW. Dmoz od dawna nie przystawał już do dominujących metod przeszukiwania Webu (czy przeszukujemy go inaczej niż przez Google?) i był przestrzenią dziwnych praktyk szemranych specjalistów od pozycjonowania.

Swego czasu było to jednak dość istotne miejsce w Sieci. Jeśli wierzyć Larremu Sangerowi, Dmoz ze swoją otwartością na wkład użytkowników oraz zasadą, że zgromadzone treści udostępniane są na wolnej licencji, miał inspirować powstanie Nupedii – potem Wikipedii. Dziś kopia zasobów Dmoz.org w wersji z marca 2017 roku dostępna jest pod adresem dmoztools.net.

O Dmozie wspominam także dlatego, że dla archiwistyki Webu to ważne źródło indeksów. Są one niezbędne do przygotowywania kwerend rozpoznających stan zachowania historycznych zasobów Sieci lub konkretnych zapytań do Wayback Machine, umożliwiających dostęp do archiwalnych kopii. Nawet jeśli możemy już korzystać tam z pełnotekstowej wyszukiwarki nie jest ona pełną alternatywą wobec punktowego pobierania konkretnych archiwalnych stron i serwisów – a do tego potrzeba starych linków. Niestety najnowszy mirror Dmoz.org nie jest tu przydatny i trzeba się odwołać do jego starszych wersji; przykładowo, ta podstrona z sierpnia 1999 roku daje nam mały zestaw linków do ówcześnie funkcjonujących stron rządowych.

Zobacz też:

Kopie wybranych stron z Dmoz.org zarchiwizowane w Bibliotece Kongresu po atakach z 11 września 2001 r.

Kwerenda w Dmoz.org jako metoda badania stanu zachowania wybranej językowej/kulturowej części Webu (artykuł niestety za paywallem):

Alkwai, L. M., Nelson, M. L., & Weigle, M. C. (2015, June). How Well Are Arabic Websites Archived?. In Proceedings of the 15th ACM/IEEE-CS Joint Conference on Digital Libraries (pp. 223-232). ACM.

Udostępnij na na Twitterze | Udostępnij na Facebooku

Przeczytaj także

Newsletter bezpieczny dla Twojego adresu email dostarcza tinyletter.com. Dowiedz się więcej