- Zasoby Cyfrowej Biblioteki Narodowej w procesie przygotowania publikacji elektronicznych
- Aplikacja mobilna mLUMEN. Agregator informacji sektora publicznego i treści z polskiej blogosfery
Masowe przetwarzanie dokumentów historycznych umożliwia rewolucję w socjologii. Dzięki udostępnieniu kompletów wydań archiwalnych polskich gazet i ich zmechanizowanemu przetworzeniu udaje się wreszcie odpowiedzieć na klasyczne pytanie: skąd się wzięła, czym była i czym jest polska inteligencja.
Karol Marks był geniuszem, ale do Polski jego teoria klas nigdy nie pasowała. A to dlatego, że podziały w polskim społeczeństwie były wyznaczane nie tyle przez stosunek do środków produkcji, co raczej przez stosunek do środków komunikacji. Marksistowska teoria klas pasowała do przemysłowych społeczeństw dziewiętnastowiecznej Europy Zachodniej i północnych stanów Ameryki, które dawały możliwość akumulowania kapitału, gdzie pieniądz rodził pieniądz, a kolejne pokolenia mogły bezpiecznie pomnażać rodzinne fortuny.
U nas było zupełnie inaczej. Bycie akcjonariuszem wielkiej fabryki albo hipotecznym właścicielem majątku ziemskiego było raczej przyczyną zgryzot i wstydu niż szczęścia i prestiżu. Mówi o tym mnóstwo świadectw historycznych, w tym pomniki polskiej literatury, jak Lalka Prusa, Rodzina Połanieckich Sienkiewicza czy Ziemia obiecana Reymonta. W Polsce, żeby mieć fabrykę, trzeba się było urodzić Niemcem lub Żydem. Z kolei posiadanie majątku ziemskiego groziło konfiskatą (w wyniku powstania, rewolucji czy zmiany granic) albo bankructwem (np. wskutek Wielkiego Kryzysu).
Posiadanie kapitału nie dawało też władzy politycznej – władzę w Polsce XIX i XX wieku dawała armia. Najpierw były to armie zaborców, które pokonały skromną armię I Rzeczypospolitej, potem zwycięska na krótko armia Napoleona, potem znowu armie zaborców. W II Rzeczypospolitej rządy ściśle cywilne były raczej wyjątkiem niż regułą, jednak wtedy, gdy rządzili cywile, były to zdecydowanie bardziej rządy klas nieposiadających (niezależnie od tego, czy na sztandarach mieli „lud”, „naród” czy „robotników”).
To nie jest nawet tak, że kapitał zupełnie nie miał znaczenia. Owszem, kapitaliści mieli wpływ na polską politykę międzywojenną, ale z jednym istotnym zastrzeżeniem: chodziło tu o kapitalistów zagranicznych, którzy kupowali polskie obligacje rządowe. Polscy kapitaliści byli zrujnowani najpierw przez I wojnę światową i zmiany granic (np. na Śląsku), a potem przez Wielki Kryzys. Dlatego polski przemysł musiał być tworzony siłami urzędników państwowych i zamówień dla armii.
A potem przyszła kolejna wojna, kolejne armie, 45 lat komunizmu… a potem znowu kapitał zachodnioeuropejski i amerykański.
Można oczywiście naciągać tradycyjne teorie klasowe na nasze warunki, tak jak próbowali to robić rosyjscy bolszewicy. Tak jak można wciąż opisywać ruchy ciał niebieskich za pomocą epicykli i teorii Ptolemeusza. Podobno nawet przez długi czas (co najmniej do Keplera) teoria heliocentryczna Ptolemeusza dawała lepsze dane obserwacyjne od istniejącej już teorii geocentrycznej Kopernika.
Ale po co naciągać starą teorię, jeżeli można to zrobić w sposób bardziej adekwatny? Wystarczy, że zamiast trzymać się wciąż marksowskiego pojęcia kapitału jako kapitału ekonomicznego (pieniężnego) rozszerzy się ją za Pierrem Bourdieu o kapitał kulturowy i społeczny. Ciekawie pokazali to R. Smoczyński i T. Zarycki w książce Totem inteligencki, w której zastosowali teorię Bourdieu do opisania polskiej triady ziemiaństwo–burżuazja–inteligencja.
I tak oto dochodzimy do naszego polskiego (ale także rosyjskiego) świętego Graala: Europą Wschodnią rządzi inteligencja. Ale czym jest owa „inteligencja”? Dwieście lat dyskusji nad tym pojęciem pokazuje, że jedyną sensowną definicją „inteligencji” jest definicja ostensywna: „inteligencją nazywamy klasę społeczną, która rządzi w Europie Wschodniej”. Przecież wszyscy wiemy, kim jest inteligent, wiemy także, kim jest „prawdziwy inteligent”, kto należy do „patointeligencji”, a kto do „lumpeninteligencji”. Możemy też wskazać „ćwierćinteligentów” i „półinteligentów”.
90 lat temu w „Wiadomościach Literackich” z 7 sierpnia 1932 roku ukazał się felieton Boya pt. Burżuazyjne szlachectwo. Boy szydzi w nim z czci, jaką obdarzano wtedy egzamin maturalny. Ach, to były przecież złote czasy inteligencji! Według Małego Rocznika Statystycznego za tenże 1932 rok, w roku 1928 w Polsce dyplomy akademickie uzyskało łącznie 3205 osób, zaś do szkół średnich ogólnokształcących (państwowych, samorządowych i prywatnych) uczęszczało łącznie 14,8 tys. uczniów (we wszystkich klasach). Porównajmy to z obecnym poziomem 744,5 tysiąca uczniów liceów ogólnokształcących – dziś jest to pięćdziesięciokrotnie więcej! Według tegoż rocznika statystycznego w roku 1929/30 w całej Polsce było 759 szkół średnich ogólnokształcących (w tym 272 państwowe i 487 niepaństwowych), co oznacza, że były to szkoły bardzo elitarne: na jedną szkołę przypadało zaledwie 20 uczniów wszystkich klas, podczas gdy dziś na jedno LO przypada średnio ćwierć tysiąca uczniów.
W czasach Boya, gdy matura była równie elitarna jak dziś doktorat, była ona – jak autor zwraca uwagę już w tytule – nową wersją szlachectwa. Dawała dostęp do pełni obywatelstwa, do studiów uniwersyteckich, ale też do kariery urzędniczej, wojskowej (oficerskiej) i przemysłowej (inżynierskiej). Stwarzało to więc pokusę, by górne warstwy społeczeństwa polskiego określać zbiorczo jako „inteligencję”, ową zaś mityczną „inteligencję” utożsamiać z ludźmi, którzy otarli się o wyższe uczelnie lub przynajmniej zdali egzamin maturalny.
Takie postawienie sprawy rodzi jednak istotny problem badawczy dla okresu wcześniejszego. Otóż przed I wojną światową na ziemiach polskich mieliśmy dwa uniwersytety polskojęzyczne (w Krakowie i Lwowie) oraz jeden rosyjskojęzyczny (Cesarski Uniwersytet Warszawski). Poza Galicją studiowało więc niewielu, a jeśli już, to zamożni lub bardzo zdeterminowani. W dodatku ciężko ustalić listy imienne studentów tych wszystkich polskich uczelni, od Petersburga i Dorpatu na wschodzie po Lozannę i Paryż na zachodzie.
W zeszłym roku ukazał się artykuł, napisany przeze mnie i prof. Rafała Smoczyńskiego z IFiS PAN, w którym zdefiniowaliśmy „klasę drukowaną”. Zdefiniowaliśmy ją nie poprzez stosunek do środków produkcji (jak Marks), ale przez stosunek do mediów. Klasa drukowana to ludzie, którzy (przed II wojną światową) posługiwali się drukowanymi gazetami do komunikacji między sobą – trochę tak, jak my dzisiaj używamy mediów społecznościowych w internecie. Artykuł był oparty na moich badaniach empirycznych (drugi autor odpowiadał za część teoretyczną).
Żeby zoperacjonalizować pojęcie klasy drukowanej wykorzystałem nekrologi publikowane w gazetach XIX-wiecznych i przedwojennych (przed wrześniem 1939). W publicznych bibliotekach cyfrowych online dostępne są całe serie tych gazet, przy czym w moich badaniach wykorzystałem komplet sześciu tytułów: „Kurier Warszawski” 1845–1939, „Dziennik Poznański” 1859–1939, „Czas” [krakowski] 1848–1939, „Słowo” [wileńskie] 1922–1939, „Ilustrowany Kurier Codzienny” [Kraków] 1910–1939 i „Dziennik Kijowski” 1906–1918. Gazety te są dostępne dla każdego i każdy mógł takie badania przeprowadzić. Wystarczyło trochę czasu (jakieś dwa i pół roku po kilkanaście godzin na dobę), dwa komputery i zapał do pracy. Mając nadzieję na znalezienie licznej grupy kontynuatorów i naśladowców opiszę pokrótce, jak praca ta przebiegała i jakie są jej efekty.
Pierwszym etapem pracy było, wykonane przez publiczne instytucje, skanowanie i udostępnienie tych gazet. W analizowanych tytułach naliczyłem 1 050 000 stron tekstu. Aby uzmysłowić, jaka to objętość, powiem tylko, że typowy papier drukarkowy zadrukowany dwustronnie to 1000 stron w pięciocentymetrowej ryzie. Aby zadrukować 1 050 000 stron potrzeba więc 1050 ryz o łącznej grubości ponad 50 metrów. Dwumetrowy regał to 6 półek, a więc do ustawienia całości potrzeba by około 9 metrów takiego regału. Na szczęście polska ustawa o dostępie do informacji publicznej pozwala na swobodne wykorzystywanie takich materiałów wytworzonych za publiczne pieniądze (z zastrzeżeniem oczywiście, że wspomniane gazety były przed wojną drukowane przez prywatne wydawnictwa i można się zastanawiać, czy istotnie współczesne instytucje publiczne miały pełne prawa do ich reprodukcji, gdy jeszcze nie minęło ustawowe 70 lat od śmierci ostatniego ze współautorów).
Dalszą część prac wykonałem już samodzielnie. Najpierw trzeba było przekonwertować gazety z mało użytecznego formatu DJVU na zwykłe pliki graficzne. Potem całość owych 1 050 000 stron przepuściłem przez program do optycznego rozpoznawania tekstu (OCR). Oczywiście, OCR na starych gazetach działa słabo – zwłaszcza na tych bardzo starych, które były jeszcze składane ręcznie przez zecera (przed erą linotypu), gdzie litery nie są bynajmniej ułożone w równych rzędach.
W każdym razie wstępny OCR pozwolił na to, by odnaleźć wszystkie strony (pliki graficzne), na których znajdują się ciągi znaków typowe dla nekrologów. A więc frazy w postaci „po długich i ciężkich cierpieniach”, „cmentarz”, „żałobne”, „pogrążeni w smutku” itp. Nie każdy nekrolog dobrze się rozpoznał automatycznie, to jasne. Ale można było przyjąć założenia, że zwykle nekrologi są publikowane na sąsiednich stronach, że każda z redakcji ma swoje zwyczaje i że wreszcie, jeżeli w jakimś numerze nie znalazłem żadnego nekrologu to znaczy, że źle szukałem i trzeba tam jeszcze raz zajrzeć własnymi oczyma.
Kolejnym etapem było przejrzenie stu kilkudziesięciu tysięcy stron zawierających nekrologi po to, by te nekrologi „powycinać”. „Wycinanie” nekrologów włożyłem w cudzysłów, bo w istocie było to oznaczanie ich skrajnych punktów. Wszystko dokonywało się cyfrowo w taki sposób, by „wycięty” nekrolog można było dokładnie umiejscowić na stronie, w której został znaleziony. Inspiracją do tego procesu był mechanizm oznaczania osób na zdjęciach w serwisie Facebook. Każdy obiekt „wycięty” z gazety w cyfrowy sposób zachował więc ścisły związek ze swoim miejscem pochodzenia.
Nekrologów udało się odnaleźć prawie pół miliona. „Nekrolog” to zresztą pojęcie bardzo obszerne. W istocie bowiem nie były to suche informacje, że właśnie zmarł jakiś bardzo stary człowiek, o którym już mało kto pamięta. Były to raczej zaproszenia na wydarzenia społeczne (wystawienie zwłok w domu i kościele, uroczystości pogrzebowe, nabożeństwa żałobne w rocznicę zgonu lub imienin) oraz także bardzo ciekawe ogłoszenia z podziękowaniami dla tych, którzy w takich wydarzeniach brali udział (łącznie z informacją, jakie utwory były grane lub śpiewane przy grobie zmarłego). Bardzo często w nekrologach używano sformułowań typu „zaprasza się rodzinę i przyjaciół Zmarłego” oraz zwrot „inne zaproszenia rozsyłane nie będą”.
Nekrologi pozwalają więc na rekonstrukcję sieci społecznej tych, którzy używali przedwojennych gazet w taki sposób, jak ludzie XXI wieku używają często mediów społecznościowych: by utrzymywać kontakty osobiste ze swoimi bliskimi: z rodziną, przyjaciółmi i sąsiadami. Jednocześnie nekrologi pozwalają na zebranie mnóstwa dodatkowych informacji o statusie społecznym zmarłych, o zajmowanych stanowiskach (prezes, minister), własności ziemskiej („były obywatel ziemski powiatu sochaczewskiego”) oraz o stosunkach rodzinnych („nieutulona w żalu wdowa z synem zapraszają…”).
Gdy wszystkie nekrologi były „wycięte”, można było ponownie poddać je automatycznemu rozpoznaniu (OCR), tym razem w dokładniejszym wydaniu. O ile imiona i nazwiska były zwykle drukowane czcionką ozdobną, na której nawet dobry program do analizy tekstu musiał się przyznać do kompletnej porażki, o tyle różne teksty pisane mniejszą, zwykłą czcionką można było już dość dobrze rozpoznać. Niemniej, około dwóch lat zajęło spisanie wszystkich imion, nazwisk, dat zgonu, wieku zmarłego i miejsca pochówku. Wstępnie też udało się zebrać słowa kluczowe dotyczące statusu społeczno-zawodowego zmarłego, choć jeszcze dużo pracy zostało do wykonania.
Wszystko to pozwoliło zbudować wirtualną encyklopedię polskiej „klasy drukowanej”, która jest dostępna pod adresem http://nekrologia.wielcy.pl jako Nekrologia Minakowskiego. Mamy tam ponad 200 000 osób, które należą do różnych „tradycyjnych” klas społecznych. Są tam zarówno rodziny urzędników, nauczycieli czy lekarzy, jak też różnego rodzaju przedsiębiorców (od wielkich kupców, bankierów i fabrykantów po członków klasy średniej: rzemieślników i subiektów). Są rzymscy katolicy (w większości), ale też liczni protestanci i kilka tysięcy starozakonnych (np. udało się odnaleźć nekrologi ponad 3000 osób spośród 80 tysięcy pochowanych na cmentarzu Żydowskim przy ul. Okopowej w Warszawie). Są nie tylko głowy rodzin, ale też ich żony, teściowe czy małe dzieci.
W Królestwie Kongresowym lat 1815-1866 (do likwidacji jego autonomii) było około 10,4 tysiąca osób pełniących różne funkcje urzędnicze, które były wymieniane w kalendarzykach politycznych. Dla 3,7 tys. z nich (a więc znacznie ponad jednej trzeciej) udało się znaleźć niewątpliwy nekrolog (a więc taki, w którym zgadza się nie tylko imię i nazwisko, ale też z brzmienia nekrologu lub innych źródeł wynika, że chodzi o tę samą osobę). Można się spodziewać, że jeżeli druga połowa tych urzędników nie ma nekrologu w tej bazie, to zapewne są tu ich rodzice, teściowie, szwagrowie, dzieci czy wnuki.
Tak więc zbudowanie bazy danych o wszystkich ciekawych mieszkańcach przedwojennej Polski (takich, o których cokolwiek napisano w jakiejkolwiek gazecie) znajduje się jak najbardziej w naszym zasięgu. Jeszcze trochę trzeba zmusić do pracy nasze komputery, wyposażyć je w trochę lepsze algorytmy (żeby nie trzeba było tyle robić ręcznie) i będzie gotowe. Do dzieła zatem!
Tarnów, w listopadzie 2022
◊◊◊
Artykuł powstał w ramach realizacji przez Bibliotekę Narodową zadania sfinansowanie działalności Centrum Kompetencji w zakresie digitalizacji materiałów bibliotecznych w 2022 roku.
◊◊◊
Dofinansowano ze środków Ministra Kultury i Dziedzictwa Narodowego