Więcej tekstów o archiwizacji Webu, historii cyfrowej i nowoczesnych instytucjach dziedzictwa? Możesz wesprzeć rozwój bloga przez wpłatę w Patronite

Muzeum Narodowe poprawiło zasięg swoich zbiorów dzięki Wikipedii

Współpraca między instytucjami kultury a społecznością Wikipedii rozwija się także w Polsce. Muzeum Narodowe w Warszawie już w 2015 roku zaczęło pracować z Wikipedią, udostępniając w repozytorium Wikimedia Commons cyfrowe reprodukcje dzieł związanych z wystawą Mistrzowie pastelu. Od Marteau do Witkacego. Rok później osią współpracy były zbiory Galerii Faras im. Profesora Kazimierza Michałowskiego – od kwietnia do września publikowano na Commons cyfrowe wizerunki obiektów z wykopalisk z granicy sudańsko-egipskiej. Powstały również nowe hasła wikipedystyczne, a cały projekt podsumowała konferencja Muzeum Cyfrowe: zbiory online, strategie cyfrowe, otwarte projekty (19 października).

Zastanawiałem się, jak udostępnienie własnych zbiorów Muzeum Narodowego na Wikimedia Commons wpłynęło na ich zasięg w internecie. Obok argumentów odwołujących się do misji instytucji dziedzictwa czy przywołujących ideę powszechnej dostępności dóbr kultury, to właśnie argumenty pokazujące konkretny wpływ wolnego udostępniania na popularność zbiorów mogą być wykorzystywane w pracy na rzecz kolejnych projektów GLAM-Wiki. Niestety, próbując zbadać ten zasięgu, napotyka się na poważne przeszkody, które niezauważone mogą wpłynąć negatywnie na jakość wyników i interpretacji:

  • zbiory Muzeum nie były publikowane na Wikimedia Commons w ramach jednego uploadu; ten proces trwał od 2015 roku i był nieregularnie rozłożony w czasie. Badając udostępniane przez Wikipedię statystyki za 2016 rok uwzględnić w nich musimy fakt, że pracowały na nie także obiekty dodane już w 2015 roku.
  • nawet podobnie definiowane jednostki miary są różnie obliczane w różnych systemach. Przykładowo, sesje w Google Analytics są obliczane inaczej niż w dMuseion, systemie, na którym postawiono Cyfrowe Muzeum Narodowe. Do tego analityka Wikipedii w ogóle nie udostępnia informacji o sesjach, pozwalając na korzystanie jedynie z danych o odsłonach (pageviews);
  • nie da się zbudować żadnego przelicznika między jakąkolwiek jednostką, w której mierzy się oglądalność obiektów publikowanych w internecie, a wizytą w siedzibie muzeum. Z tego powodu trudno bezpośrednio porównywać wyniki oglądalności serwisu muzeum cyfrowego z liczbą wizyt na miejscu;

Te podstawowe niejasności i ograniczenia to dla mnie kolejny argument, żeby w analizowaniu społecznego znaczenia obecności zdigitalizowanych zbiorów kultury w internecie raczej koncentrować się na efektach jakościowych niż na ilościowych. Z drugiej strony jednak trudno ignorować dostępne dane – w badaniach efektów digitalizacji nie mamy ich zbyt wiele. Można z nich skorzystać choćby w celach ilustracyjnych, unikając przy tym wyciąganie daleko idących wniosków.

Ponieważ, tak jak pisałem wyżej, Wikipedia nie udostępnia danych o sesjach, porównanie mogłem przygotować wyłącznie o bardzo niewygodne, zbyt ogólne i podatne na manipulacje odsłony. Porównałem dane z Wikipedii, dMuseion, Google Analytics i dane o wizytach w siedzibie muzeum z ostatnich trzech miesięcy 2016 roku przyjmując, że do końca września Muzeum opublikowało w Wikimedia Commons wszystkie zakładane planowane reprodukcje cyfrowe (projekt Faras kończył się właśnie we wrześniu). Dane o odsłonach dotyczyły więc całości zbiorów Muzeum na Wikimedia Commons (675 obiektów) i całości zbiorów Muzeum w serwisie Cyfrowe Muzeum Narodowe (30387 obiektów do końca 2016). Na Wikimedia Commons publikowanych było zatem jedynie 2 proc. dostępnych na stronach Muzeum Narodowego reprodukcji.

Okazuje się jednak, że te 2 proc. udostępnione na Commons generują radykalnie wysoką liczbę odsłon w porównaniu z tym, ile odsłon generuje cały zasób publikowany w dMuseion. Odsłony mierzone na Wikipedii to odsłony stron haseł, w których treści opublikowano reprodukcje z Muzeum Narodowego.

Dla porównania (przy wszystkich wadach takiego zestawienia) dodałem do wykresu dane o wizytach na miejscu. Dane w tabeli prezentują się tak:

październik 2016 listopad 2016 grudzień 2016
pageviews_wikipedia 3517975 3208680 3020337
pageviews_cmn 434191 455789 405628
pageviews_google 63539 75250 60727
wizyty na miejscu 26145 22661 20426

Jak można zinterpretować taki wynik? Wikimedia Commons to dobre – jeśli chodzi o zasięgi – narzędzie do upowszechniania zbiorów dziedzictwa, generujące o wiele większą widoczność niż strona domowa muzeum. Z drugiej strony widoczność ta ściśle związana jest z wykorzystaniem wybranych plików jako ilustracji do treści konkretnych wikihaseł – cyfrowe reprodukcje na stronie domowej muzeum publikowane są bez takiego kontekstu.

Dziękuję Karolinie Tabak i Marcinowi Werli za pomoc przy przygotowaniu tej notki.

Udostępnij na na Twitterze | Udostępnij na Facebooku

Przeczytaj także