Więcej tekstów o archiwizacji Webu, historii cyfrowej i nowoczesnych instytucjach dziedzictwa? Możesz wesprzeć rozwój bloga przez wpłatę w Patronite

Jak w prosty sposób archiwizować linki udostępniane przez siebie na Twitterze?

Archiwizowanie Twittera to nie tylko zabezpieczanie wybranych wpisów czy dokumentowanie relacji między użytkownikami, ale także dbanie o dostępność treści linkowanych z tweetów. To ważne nie tylko w projektach badawczych na mediach społecznościowych. Być może także zwykli użytkownicy czy instytucje chcieliby niezależnie dokumentować swoją działalność na Twitterze w taki sposób, aby możliwie wszystkie publikowane tam treści zostały odpowiednio zabezpieczone.

Mamy ograniczoną możliwość ściągnięcia metadanych i treści historycznych oraz bieżących tweetów. Eksplorując API w odpowiedni sposób możemy też pobrać wszystkie udostępnione na serwerach Twittera materiały wizualne, publikowane np. przez wybranego użytkownika. W wielu tweetach znajdują się adresy URL – możemy je wyciągnąć automatycznie z kwerendy za pomocą biblioteki Twarc (pod pythona).

Niestety w przypadku adresów URL Twitter nie zabezpiecza dostępności stron WWW czy innych obiektów Webu, do których linkują tweetujący użytkownicy. W efekcie, chcąc przygotować dobrą kopię wpisów wybranej kwerendy, powinniśmy umieszczane w nich linki samodzielnie zarchiwizować. Możemy zrobić to nie tyle pobierając umieszczone pod nimi strony WWW i archiwizując gdzieś na dysku, ale raczej wysyłając odnośniki do Wayback Machine, które zrobi za nas odpowiednie kopie (i weźmie na sobie całe ryzyko związane z prawem autorskim). Oczywiście linki do Wayback Machine należałoby wysłać automatycznie ze względu na wielką liczbę adresów do przetworzenia.

Taka metoda jest do zastosowania w projektach badawczych czy dokumentacyjnych, ale trudno wymagać, aby mogły stosować ją na co dzień zwykli użytkownicy czy instytucje, które chciałyby niezależnie zabezpieczać ślady swojej działalności na Twitterze. Potrzebne byłoby proste, dostępne i darmowe narzędzie, wykonujące tę pracę w tle, bez zmuszania użytkownika czy użytkowniczki do jakiejkolwiek pracy z kodem.

@LinkArchiver to działający na Twitterze bot, pozwalający w prosty sposób wysyłać wszystkie URLe publikowane w tweetach użytkownika do Wayback Machine. Mechanizm jego działania jest następujący:

  • użytkownik (np. nasza instytucja chcąca niezależnie dokumentować swoją działalność na Twitterze) musi zacząć obserwować konto @LinkArchiver;
  • w odpowiedzi @LinkArchiver zacznie obserwować konto naszej instytucji;
  • za każdym razem, kiedy z tego konta zostanie wysłany tweet zawierający jakikolwiek adres URL, @LinkArchiver zgłosi go do archiwizacji w Wayback Machine;

I jeszcze:

  • jeśli w tweecie zamieści się wzmiankę konta @LinkArchiver wraz z dowolnym adresem strony WWW, @LinkArchiver zwróci tweeta z odnośnikiem do kopii tej strony wygenerowanej w Wayback Machine.

Autor bota, Parker Higgins, porozumiał się z zespołem Internet Archive i @LinkArchiver dostał zielone światło na masowe wysyłanie linków do archiwizacji w Wayback Machine. Kod źródłowy bota dostępny jest na GitHubie.

@LinkArchiver przydać się może twitterowym kontom mediów, dziennikarzy, instytucji naukowych czy nawet partii politycznych, które mogą być zainteresowane stałą dostępnością materiałów wskazywanych (linkowanych) w publikowanych przez siebie tweetach.

Udostępnij na na Twitterze | Udostępnij na Facebooku

Przeczytaj także