Proszę o wsparcie dla Krzysia Bulczaka, największego bohatera jakiego znam.

Zmiany w usłudze Save Page Now (SPN)

poprzedniej notce pisałem o sposobie na automatyczną archiwizację stron WWW w Wayback Machine z wykorzystaniem usługi Save Page Now. Dziś Internet Archive poinformowało o zmianach w tej usłudze. Nowe możliwości SPN wyglądają naprawdę obiecująco – poniżej krótkie podsumowanie:

  • Roboty Wayback Machine są teraz w stanie poprawnie interpretować strony wykorzystujące JavaScript; robot wchodzi na stronę z wykorzystaniem prawdziwej przeglądarki – ale działającej w trybie headless z pomocą Brozzlera. Oznacza to, że archiwizowane w WM kopie będą miały lepszą jakość, możliwe jest też automatyczne generowanie screenshotów;
  • użytkownik może wybrać opcję archiwizowania nie tylko podanego przez siebie adresu, ale też dodatkowo wszystkich adresów linkowanych z podanej strony;
  • użytkownik posiadający darmowe konto w archive.org może tworzyć własne publiczne kolekcje archiwizowanych stron;
  • SPN jest w stanie parsować URLe zawarte w dokumentach PDF i formatowanych plikach tekstowych (JSON,RSS);
  • dostępne jest nowe API (na razie brak szczegółów).

Grafika: Johannes Woudanus, biblioteka w Lejdzie, XVII w., Wikimedia Commons.

Przeczytaj także:

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Akceptowane są wyłącznie komentarze merytoryczne. Każdy komentarz podlega moderacji.

Udostępnij na Twitterze | Udostępnij na Facebooku