Historia Wikipedii ukryta pod przeglądarką

W piątek zakończyła się na UMK konferencja Wizualizacja informacji w humanistyce. Podczas organizowanej przy okazji dyskusji o cyfrowej humanistyce wiele mówiono o metodach i narzędziach cyfrowych w badaniach, próbowano też definiować samo pojęcie (co akurat nie jest już dziś najlepszym pomysłem). Rozmowa koncentrowała się wokół pytań, na które dawno już odpowiedziano: czy humaniści mogą używać metod cyfrowych z klasycznymi metodami analogowymi (mogą) albo czy da się pracować w zespołach humanistyczno-informatycznych (da się). Odpowiedzi na te pytania pojawiły się zresztą dość dawno – przecież Roberto Busa rozpoczął swój projekt wydań cyfrowych św. Tomasza w 1946 roku, a pierwsze dyskusje o wykorzystaniu komputerów w muzeach (także do pracy ze zbiorami dziedzictwa) i jakiejś pre-postaci sieci łączącej te instytucje to lata 70. XX wieku. Na końcu spotkania udało mi się zabrać głos i dodać kilka słów o tym, że obok metod i narzędzi wartością humanistyki jest też przecież jakaś nieustanna perspektywa krytycznego patrzenia na rzeczy, które na pierwszy rzut oka wydają się jasne i oczywiste.

Bardzo spodobało mi się, kiedy w trakcie niedawnego wykładu w LaCH UW, Paweł Janicki powiedział, że programowanie może być esencją współczesnej epistemologii. Można to rozwinąć do stwierdzenia, że jeśli umiesz programować albo przynajmniej czytać ze zrozumieniem kod źródłowy, orientujesz się w zasadach działań protokołów czy logice bazy danych, jesteś w stanie zajrzeć pod powierzchnię ekranu i być może rozumieć więcej, a przynajmniej stawiać nowe pytania, odwołując się do misji krytycznej, jaką ma humanistyka.

Proszę, oto konkretny przykład. W artykule z kwietnia 2015 roku, zamieszczonym w MIT Technology Review, James Somers pisze o wpływie języków programowania na sposób myślenia programistów oraz – pośrednio – na społeczny efekt tworzonych w tym językach programów i serwisów. Tekst zaczyna od przywołania narzekań na język PHP i historii powstawania Facebooka, budowanego od początku w tym właśnie języku (Wikipedia i miliony instalacji WordPressa działają także w oparciu o PHP). PHP zdecydowanie nie jest językiem, który ma dziś dobrą prasę, także dlatego:

Programmers’ favorite example is a PHP function called “mysql_escape_string,” which rids a query of malicious input before sending it off to a database. (For an example of a malicious input, think of a form on a website that asks for your e-mail address; a hacker can enter code in that slot to force the site to cough up passwords.) When a bug was discovered in the function, a new version was added, called “mysql_real_escape_string,” but the original was not replaced. The result is a bit like having two similar-looking buttons right next to each other in an airline cockpit: one that puts the landing gear down and one that puts it down safely. It’s not just an affront to common sense—it’s a recipe for disaster.

PHP ma być toporny, nieelegancki, być może dla niektórych to po prostu jakaś programistyczna prowizorka. Ale PHP jest przy tym wszystkim dobry do tego, żeby coś szybko zacząć. Łatwo się w nim pisze i szybko można postawić pierwszą wersję serwisu czy aplikacji – skrót PHP pochodzi oryginalnie od personal home page. Czasem taki start determinuje dalsze losy projektu. Facebook czy Wikipedia zaczęły się w PHP i w PHP są nadal rozwijane. Co więcej, jak w przypadku rozbudowywanej kolektywnie Wikipedii, PHP jako język z niewysoką barierą wejścia umożliwił społeczności składającej się też z mniej doświadczonych programistów i programistek rozwijać własne moduły wzbogacające możliwości tej sieciowej encyklopedii np. o wyświetlanie zapisów nutowych czy hieroglifów umieszczanych w treści haseł o historii Egiptu. Z drugiej strony to właśnie z powodu PHP tak bardzo opóźniać się miało ulepszanie edytora haseł czy publikacja wersji mobilnej Wikipedii:

PHP’s get-going-ness was crucial to the success of Wikipedia, says Ori Livneh, a principal software engineer at the Wikimedia Foundation, which operates the project. “I’ve always loathed PHP,” he tells me. The project suffers from large-scale design flaws as a result of its reliance on the language. (They are partly why the foundation didn’t make Wikipedia pages available in a version adapted for mobile devices until 2008, and why the site didn’t get a user-friendly editing interface until 2013.) But PHP allowed people who weren’t—or were barely—software engineers to contribute new features. It’s how Wikipedia entries came to display hieroglyphics on Egyptology pages, for instance, and handle sheet music.

Dla powstania Wikipedii społecznościowe kodowanie było nie mniej istotne niż pomysł na społecznościowe tworzenie haseł, a w obu przypadkach kluczowa okazała się niska bariera wejścia. Takie spojrzenie pod powierzchnię tego, co widać w przeglądarce, może być wartościowe. Nie chodzi przy tym o przeglądanie kodu, czasem wystarczy świadomość tego, że nie wszystko widać na pierwszy rzut oka. Na przykład, ważna część edycji haseł Wikipedii jest generowana przez rozmaite boty – Wikipedia nie jest więc przestrzenią wiedzy, do której wkład wnoszą jedynie ludzie. W podobny sposób można badać też biblioteki cyfrowe – historia i kształt polskich projektów oraz rozpoznawanie ich społecznego znaczenia będzie przecież ograniczone bez uwzględnienia właściwości formatu DjVu: nie tylko tych utrudniających korzystanie ze zdigitalizowanych zbiorów, ale także tych umożliwiających kompresję czy publikowanie wielostronicowych plików z różnymi warstwami.

I dalej, rozpoznawanie literackości w tekście źródłowym (critical code studies) czy metafor wbudowanych w graficzny interfejs użytkownika (pulpit, strona WWW, dyskietka jako ikona zapisu pliku itp.), badanie kulturowego czy językowego znaczenia interfejsów, archiwizacja i badanie dziedzictwa born digital to nowe zadania, które można podjąć w ramach badań humanistycznych, jeśli tylko przestanie się traktować kod, interfejs czy komputer jak przezroczyste narzędzia.

Somers, J. (2015). Toolkits for the Mind. MIT Technology Review, 118, 3, 80-83.

Udostępnij na na Twitterze | Udostępnij na Facebooku

Przeczytaj także

Newsletter bezpieczny dla Twojego adresu email dostarcza tinyletter.com. Dowiedz się więcej