- Drugie życie „starych gazet”, czyli humanistyka cyfrowa w inteligentnej bibliotece na przykładzie korpusu prasy polskiej ChronoPress
- Długotrwałe przechowywanie informacji cyfrowej w pytaniach i odpowiedziach
W pisaniu o bibliotekach cyfrowych wygodnie posługiwać się metaforami. Niedawno Paul Gooding i Melissa Terras przeanalizowali obecność nawiązań do biblioteki Babel Borgesa i biblioteki aleksandryjskiej w piśmiennictwie o bibliotekach. W artykule Inheriting library cards to Babel and Alexandria: contemporary metaphors for the digital library (2017) opracowali pod tym kątem 432 publikacje w języku angielskim – od tekstów naukowych przez artykuły dziennikarskie po blogi branżowe.
Do tego Gooding i Terras, we wstępie do swojego tekstu, postarali się krótko omówić rolę metafor: przytoczeni przez nich autorzy podkreślają, że biblioteki zawsze chętnie opisywano figuratywnym językiem, bo pozwalało to nie tylko łatwo oddać znaczenie i rolę, jaką chciano im przypisać, ale także wskazać przyszłe możliwości rozwoju. Przecież metafory formatują rozumienie opisywanego nimi obiektu i działa to oczywiście nie tylko w przypadku bibliotek. Na przykład „infostrada” jako popularne określenie wczesnego Internetu podkreślała szybkość i bezpośredniość komunikacji, ignorując jej techniczne i społeczne ograniczenia, a do dziś sieć WWW – jedna z usług internetowych – jest powszechnie uznawana za reprezentację całego internetu.
Jakiś czas temu postanowiłem poszukać zachowanych w archiwach Webu resztek pierwszych polskich projektów, które określano jako „biblioteki cyfrowe”. W założonej w 1997 roku „Bibliotece sieciowej” użytkownik mógł skorzystać z udostępnianych tam tekstów na dwa sposoby: albo przeczytać je w „czytelni” (czyli na podstronie serwisu), albo „wypożyczyć”, co oznaczało ściągnięcie na dysk twardy pliku .zip z książką. Oczywiście z prawdziwym bibliotecznym wypożyczaniem takie cyfrowe wypożyczanie nie miało to nic wspólnego – w bibliotece cyfrowej stało się po prostu metaforą, być może mającą zredukować dystans między serwisem udostępniającym pliki tekstowe a jego użytkownikami, nadać mu bardziej przyjazną i rozpoznawalną formę. Jeśli w krytycznej analizie popularnych metafor pójdziemy odpowiednio daleko może okazać się, że samo pojęcie „biblioteki cyfrowej” staje się metaforą.

Wbrew pozorom nie jest to jedynie problem teoretyczny. Po pierwsze, metafora 'biblioteki cyfrowej’ nie musi być dla wszystkich czytelna, a zatem lepiej pytać po prostu o portale publikujące zasoby kultury (jak w tym badaniu). Po drugie, trudno jednoznacznie wskazać granice tego, co przez tę metaforę jest opisywane (co świetnie pokazuje ten artykuł). Czy mówimy o całej infrastrukturze i organizacji – od pracowni skanujących zbiory biblioteczne po kod interfejsu serwisu je udostępniającego? A może „biblioteka cyfrowa” to – jak w starej definicji z polskiej Wikipedii – po prostu strona internetowa realizująca specyficzne zadania?
Płynne granice biblioteki cyfrowej
Dla większości użytkowników, chcących korzystać z zasobów kultury online, te teoretyczne niepewności nie mają jednak znaczenia. Przestrzeń biblioteki cyfrowej jest dla nich po prostu rozszerzeniem wyszukiwania w Google, linkiem z mediów społecznościowych, jedną z tysięcy potencjalnych stron udostępniających poszukiwany materiał. Ten wymiar funkcjonowania profesjonalnych serwisów instytucji kultury doskonale opisuje przypadek „żółtej Mleczarki” i Rijksmuseum. Muzea, archiwa czy biblioteki cyfrowe nie są w żaden sposób wyróżniane i preferowane. Wyświetlają się w przeglądarkach dzięki temu samemu protokołowi co inne strony WWW, nie posiadają nawet dedykowanych domen (jak to jest w przypadku sfery .gov). Dla dominującego interfejsu wyszukiwarki Google są stroną jak każda inna, proponowaną użytkownikowi obok tysięcy stron amatorskich, komercyjnych, niepoważnych lub potencjalnie niebezpiecznych.
Być może też takie doświadczenie sprawia, że osoby odpowiedzialne za prowadzenie bibliotek cyfrowych koncentrują się tak mocno na ich wyróżnianiu spoza milionów innych witryn i tak bardzo niepokoją się statystykami ich odwiedzin. Chodzi o to, aby nie zginąć w tłumie i dotrzeć ze swoimi zbiorami do szerokiej grupy odbiorców. Problem w tym, że zdecydowana większość bibliotek cyfrowych nigdy nie będzie gwiazdą internetu, co wynika ze specyfiki udostępnianych treści (zasoby kultury, zazwyczaj niewspółczesne czy zasoby naukowe) oraz braku poważnych środków na szeroką i intensywną promocję. Poza tym efektywność biblioteki cyfrowej należałoby mierzyć w perspektywie wielu lat a nie okresów finansowania z poszczególnych grantów.
Być może jednak ważniejszym argumentem przeciwko traktowaniu biblioteki cyfrowej jako jeszcze jednego serwisu WWW są współczesne próby upowszechniania zbiorów bibliotek poza ich macierzystymi domenami. Federacja Bibliotek Cyfrowych, Europeana czy DPLA to propozycja wyszukiwania zbiorów wśród tysięcy bibliotek, ale korzystając z jednego interfejsu. Podobnie API, interfejs programistyczny pozwalający na automatyczne pozyskiwanie i przetwarzanie zbiorów, a także informacji o nich, zupełnie ignoruje identyfikację wizualną biblioteki, a nawet niekiedy jej oficjalną domenę. Przykładowo, w pakiecie musemeta dla języka R użytkownik jest w stanie szybko pozyskiwać i przetwarzać metadane zbiorów kilku muzeów nie tylko nie wchodząc na ich strony, ale też nawet nie znając ich adresów. Podobnie jest z metadanymi publikowanymi swobodnie w repozytoriach – żeby korzystać z metadanych Metropolitan Museum of Art wystarczy ściągnąć duży plik CSV bezpośrednio z serwisu GitHub.
Strona czy aplikacja?
Serwis WWW z tysiącami podstron już dawno przestał być jedyną postacią biblioteki, muzeum czy archiwum cyfrowego. O ile serwisy agregujące metadane (takie jak Europeana), a zwłaszcza API lub publikowanie metadanych w otwartych repozytoriach ignorują interfejs graficzny biblioteki cyfrowej i odchodzą od operowania stronami WWW, w modelu Single Page Application (SPA) zmienia się w ogóle filozofia tego, czym ma być strona internetowa.
W dużym skrócie SPA to taka postać prezentowania zasobów i danych w przeglądarce, która bardziej przypomina aplikację mobilną lub program komputerowy instalowany na dysku niż klasyczną witrynę WWW. W witrynie SPA użytkownik nawiguje po określonych stanach (states), a nie kolejnych podstronach (pages) wyróżnianych unikalnym adresem URL. To trochę powrót do połowy lat .90, kiedy korzystać można było z zasobów kultury publikowanych jako programy na dyskach CD.
W SPA za cenę rezygnacji z unikatowych URL uzyskuje się większą szybkość i elastyczność witryny. Aplikacja Culture Collage jest dobrym przykładem wdrożenia takiej filozofii do prezentacji zbiorów kultury. W jednym interfejsie (i pod za każdym razem jednym adresem URL) użytkownik otrzymuje propozycje zbiorów z wielu różnych bibliotek na raz, przy czym sama aplikacja nie przechowuje i nie udostępnia żadnych własnych zasobów. Podstawą tego rozwiązania są publiczne API wielu instytucji dziedzictwa oraz język JavaScript, pozwalający na dynamiczne podmienianie treści w poszczególnych stanach aplikacji. Mamy tam też możliwość zachowywania w przeglądarce własnych kolekcji wyszukanych zbiorów, przy czym – co charakterystyczne – interfejs kolekcji jest jednym ze stanów aplikacji, ukrytych pod wspólnym adresem URL.
Współczesne możliwości techniczne pozwalają na eksperymentowanie z klasyczną postacią biblioteki cyfrowej. Niektóre z rozwiązań stały się standardem (dystrybucja metadanych czy własne API), niektóre są wciąż – i pozostaną – propozycją jedynie dla wybranych instytucji (aplikacje SPA czy boty w mediach społecznościowych). Warto wziąć pod uwagę nowe, możliwe postacie biblioteki cyfrowej podczas wypracowywania sposobów ewaluacji jej działalności i przy planowaniu jej kolejnych internetowych wersji.