Proszę o wsparcie dla Krzysia Bulczaka, największego bohatera jakiego znam.

Histmag vs Ciekawostki Historyczne: clickbait i pisanie o przeszłości

Clickbait to zgrabny neologizm oznaczający treści internetowe, których temat, styl i postać sformatowana jest w celu zapewnienia możliwie największej oglądalności, przekładającej się na liczbę odsłon reklam. Pod klikalność i oglądalność formatować można także teksty popularnonaukowe, w tym te dotyczące historii. Jak jednak rozpoznać historyczny clickbait?

Inspiracji szukać można w popularnych polskich serwisach historycznych. Ciekawostki historyczne oraz Histmag odwiedzane są przez pół miliona osób miesięcznie (odpowiednio 350150 tys. unikalnych użytkowników). Działając online jako komercyjne projekty, oba portale podlegają dominującym trendom medialnym i językowym oraz – w różnej skali – formatowaniu treści wynikającemu z konieczności uzyskania odpowiednio wysokiej oglądalności.

Pobieżna lektura artykułów publikowanych w obu serwisach pozwala wstępnie rozpoznać cechy języka i charakter obu serwisów. Histmag różnić się będzie od Ciekawostek wyborem tematów historycznych, długością artykułów oraz stylem ich pisania. Ciekawostki mają charakter sensacyjny, powierzchowny, teksty tam umieszczane nastawione są na szybką lekturę i skuteczne rozpowszechnianie w mediach społecznościowych, także w kręgach odbiorców interesujących się historią wyłącznie z powodów estetycznych czy emocjonalnych. To właśnie ten serwis w znacznym stopniu formatować będzie tytuły pod jak najwyższą klikalność.

Analiza tytułów

No dobrze, ale jak rozpoznać historyczny clickbait? Nie zależy mi na krytykowaniu jakości wiedzy proponowanej przez oba projekty, ale przetestowaniu metod, które pozwoliłyby na badanie ujawniającego się online języka pisania o historii.

Do prostej, wstępnej analizy wykorzystałem tytuły artykułów merytorycznych publikowanych w obu portalach. Nie są to tytuły wszystkich publikacji tam dostępnych (pominąłem informacje o wydarzeniach, felietony, strony informacyjne itp.). Dzięki import.io błyskawicznie pobrałem zestaw 1936 tytułów z Histmaga i 923 tytułów z Ciekawostek. Następnie wyczyściłem oba zbiory, usuwają znaki interpunkcyjne, cyfry arabskie oraz śmieciowe wyrazy wg. listy Wikipedia:Stopwords. Powstały dwie listy, na podstawie których obliczyć można już było frekwencję poszczególnych wyrazów, pojawiających się w tytułach artykułów z obu portali.

Poniżej pierwsze dwadzieścia wierszy z listy frekwencyjnej. Kolorem oznaczyłem wyrazy pojawiające się na tym niewielkim zestawieniu wyłącznie w jednym portalu, przy czym zrezygnowałem z oznaczania różnych form wyrazów Polska, historia, świat oraz cyfr rzymskich, będących elementami bez istotnej wartości dla tego porównania. Tabela przedstawia się następująco:

histmag ciekawostki
1 historia polsce
2 ii naprawdę
3 polski polski
4 wojny ii
5 bitwa wojny
6 wojna życie
7 historii historia
8 iii prawda
9 wieku hitlera
10 świata polacy
11 światowej polska
12 początki przedwojennej
13 polsce światowej
14 polska hitler
15 polskie armii
16 prasy historii
17 matura polscy
18 polskiego najbardziej
19 przegląd niemcy
20 latach wieku

Pełne listy – w postaci plików .csv udostępniam na GitHubie.

Rozpoznawanie clickbaitu

Na liście frekwencyjnej Ciekawostek zaskakuje wysoka pozycja partykuły naprawdę. Pozbawione merytorycznego znaczenia naprawdę podkreśla demaskatorski i sensacyjny charakter publikowanych treści. Portal odwołuje się do powszechnej wiedzy historycznej, aby w kolejnych sensacyjnych tytułach ją kwestionować i pokazać, jak to rzeczywiście było. W tytułach Ciekawostek często pojawia się także rzeczownik prawda, sugerujący czytelnikom, że po kliknięciu w tekst będą mogli dotrzeć do niedostępnej dotąd wiedzy.

Clickbait rozpoznać można także przez zaczepny styl tytułów, wzmacniany przez bardzo częste wykorzystywanie zdań pytających. Warto byłoby przy tym sprawdzić, czy zastosowanie tu miałoby Prawo nagłówków Betteridge’a, zgodnie z którym na każdy nagłówek [tytuł] kończący się znakiem zapytania można odpowiedzieć „nie”.

tytuły tytuły zawierające zdania pytające %
histmag 1936 225 11.6
ciekawostki 923 423 45.8

Oba zbiory tytułów różnią się także zdecydowanie liczbą wykrzykników pojawiających się w zdaniach:

tytuły wykrzykniki %
histmag 1936 25 1.2
ciekawostki 923 146 15.8

Sensacyjny charakter portalu historycznego kształtowany być może również przez częste przywoływanie mniej lub bardziej zasadnych naukowo kontrowersji dotyczących powszechnie znanych postaci historycznych. W zestawieniu najpopularnieszych wyrazów z tytułów Ciekawostek zwraca uwagę obecność w pierwszej dwudziestce aż dwóch postaci leksemu Hitler – na pełnej liście jest 35 tytułów przywołujących Hitlera, nieraz w radykalnie zaskakujących kontekstach:

parszywe elfy Hitlera

groupies Hitlera

człowiek Hitlera, człowiek sukcesu

Na Histmagu Hitler pojawia się jedynie w 22 tytułach.

Ponieważ zanalizowanie większej części wyrazów z list frekwencyjnych zajęłoby wiele czasu, warto przyspieszyć interpretowanie, korzystając z prostej wizualizacji. Poniżej chmury słów dla obu portali.

Ciekawostki Historyczne: [od 25 do 500 słów, źródło]


Histmag: [od 25 do 500 słów, źródło]


W tytułach obu portali widać koncentrację na historii Polski – lub przynajmniej dominację polskiej perspektywy historycznej. Widać też silną obecność tematów wojennych i militarnych (popularność leksemu bitwa w tytułach Histmaga), chociaż tu łatwo popełnić błąd interpretacyjny: pojawiający się w tytułach leksem wojna sugerować może nie tylko artykuł poświęcony broni czy strategii, ale też np. tekst opisujący sytuację ludności cywilnej czy po prostu przywołujący wyraz wojna jako wskaźnik chronologiczny (II wojna światowa).

Chmura jako metoda wizualizacji nie pozwala na dostrzeżenie takich różnic, dlatego lepiej skorzystać z konkordancji, ukazującej kontekst każdego wystąpienia interesującego nas wyrazu. Można go wygenerować na bazie udostępnionych przeze mnie list tytułów za pomocą darmowego programu TextSTAT.

textstat

Nieco więcej teorii

Analiza tytułów sprawdza się jako wstęp do oceny stylu obu portali historycznych, jednak aby napisać coś więcej na temat ich charakteru należałoby zanalizować treści artykułów oraz przejrzeć literaturę dotyczącą badania clickbaitu. Okazuje się, że jedną z metod rozpoznawania tak formatowanych tytułów może być analiza tego, jak język i struktura zdań wskazują na treści poza nimi (Blom i Hansen, 2015). Przykładowo tytuł:

Gdyby temu biskupowi się udało, dzisiaj mówilibyśmy po czesku

zbudowany jest z wykorzystaniem katafory, wyrazu odnoszącego się do tego, co w wypowiedzi dopiero nastąpi (w tym przypadku kataforą jest wyraz temu). W mniej nastawionej na wygenerowanie klików wersji tego tytułu biskup zostałby przywołany bezpośrednio z imienia i nazwiska. Blom i Hansen wskazują, że obecność katafor i charakterystycznej dla niej referencyjności “do przodu” (forward-reference) charakteryzuje clickbaitowe nagłówki. Inny przykład:

Nie uwierzysz, że oni to jedli. 10 szokujących okupacyjnych potraw

Ten Niemiec zestrzelił ponad sto samolotów. I tylko z Polakami nie potrafił sobie poradzić…

Skuteczność katafory wzmocnić można lub nawet zastąpić odpowiednim czasownikiem (najlepiej w trybie rozkazującym):

Jesteś pracownikiem czy niewolnikiem? Sprawdź!

Można też wykorzystać referencyjność “do przodu” bez konkretnej katafory (discourse deixis):

Co trzeba było zrobić, by przetrwać w Auschwitz?

Jak naziści chrzcili swoje niemowlęta?

Wszystkie cytowane tytuły pochodzą z serwisu Ciekawostki Historyczne.

Podsumowanie

Clickbait budowany wokół tematów historycznych to nie tylko świadectwo starań o uwagę użytkownika, ale też ciekawy problem w badaniu języka pisania o przeszłości. Dostępność dużej liczby tekstów historycznych w postaci cyfrowej pozwala w nowy sposób badać historiografię. Zresztą nie tylko tę popularnonaukową – wiele czasopism historycznych publikowanych jest dziś w otwartym dostępie, więc analizie języka i stylu poddać możemy także teksty naukowe.

Formatowanie tematów historycznych pod liczbę kliknięć to dla mnie też pewien problem etyczny, zwłaszcza kiedy przetwarzaniu podlegają tematy zasługujące na szczególną powagę i poważne traktowanie. Nie chodzi tu wyłącznie o konkretne zagadnienia historyczne (takie jak Zagłada), ale uniwersalne ludzkie dramaty – przemoc, głód, gwałty. Tworzenie sensacyjnych treści wykorzystujących historyczne doświadczenia zła nie jest w porządku, nawet jeśli motywuje się to efektem edukacyjnym o dużym zasięgu.

Zachęcam do samodzielnego analizowania udostępnionych na GitHubie zestawów tytułów i list frekwencyjnych z obu portali.

Wykorzystana literatura: Blom, J. N., & Hansen, K. R. (2015). Click bait: Forward-reference as lure in online news headlines. Journal of Pragmatics, 76, 87-100. [link]

Grafika: Gelderland Bibliotheek

Przeczytaj także:

Udostępnij na Twitterze | Udostępnij na Facebooku