Polona/Labs

[Polona w 2013 r.]

Kiedy w 2013 roku uruchomiliśmy POLONĘ w jej nowej odsłonie, nastąpił z pewnością ogromny skok w otwartości zbiorów cyfrowych – czy nawet szerzej: dostępności całego dziedzictwa kultury i dziedzictwa informacyjnego. Przyrastające z każdym dniem zasoby (dość powiedzieć, że zaczynaliśmy od skromnych 40 000, a w październiku 2017 roku osiągnęliśmy 2 000 000), nowatorski system prezentacji i pracy ze zdigitalizowanymi materiałami, pobieranie plików w najwyższej dostępnej rozdzielczości – była to w podejściu do technologii i koncepcji udostępniania zbiorów rewolucja na skalę globalną.

Obecna wersja, POLONA/2miliony, idzie jeszcze dalej: otwarte API, brak ograniczeń w pobieraniu dostępnych formatów plików, możliwość wyświetlania warstwy tekstowej na zdigitalizowanych obiektach, panele prasy i instytucji, możliwość tworzenia własnych kolekcji – to tylko kilka przykładów z serwisu, który jest regularnie aktualizowany i rozwijany o nowe funkcjonalności.

Uruchomieniu każdej nowej wersji POLONY towarzyszy jednak pytanie: co możemy zrobić więcej? I czy idea otwartości zbiorów już doszła do granic wyznaczonych przez zoptymalizowane przeszukiwanie i nieograniczone pobieranie danych?

Zbiory bibliotek cyfrowych zazwyczaj ograniczają się do zdigitalizowanych kolekcji ich macierzystych instytucji lub konsorcjów działających w jednym projekcie. POLONA zaczynała w oczywisty sposób od Biblioteki Narodowej, a w kolejnych latach dołączyły do niej zbiory Biblioteki Książąt Czartoryskich, Instytutu Teatralnego im. Zbigniewa Raszewskiego, Narodowego Instytutu Fryderyka Chopina i Państwowego Muzeum Etnograficznego, a w ramach jednego z największych na świecie projektów digitalizacyjnych – „Patrimonium” udostępnione zostaną również zbiory Biblioteki Jagiellońskiej. Centralizacja zasobów i unifikacja standardów ułatwia nie tylko zachowanie danych, ale również pracę użytkowników, którzy przestają być skazani na agregatory rozproszonych materiałów o różnej jakości i stopniu dostępności. Nadal jest to jednak zamknięty zasób, ograniczony przez założenia i politykę dysponentów kolekcji, a temat „zmiany mentalności” wobec digitalizacji i udostępniania w instytucjach kultury wciąż niestety jest aktualny. A nawet jeśli przezwyciężony zostałby „syndrom chomika” (tj. tendencja do chomikowania danych i pod żadnym pozorem nie pokazywania ich światu), to wciąż pozostaniemy w jednym interfejsie i w jednym zamkniętym, choć nawet i wielomilionowym, zasobie.

Chomik z Atlasu państwa zwierzęcego Kurta Lamperta (Warszawa 1925)Chomik z Atlasu państwa zwierzęcego Kurta Lamperta (Warszawa 1925)

Tymczasem w bibliotekach cyfrowych i nastawieniu użytkowników dokonuje się kolejna zmiana. Stają się one nie tylko miejscem przechowywania i udostępniania zasobów, ale także miejscem pracy z nimi. Slogan twórców wcześniejszych generacji bibliotek cyfrowych, mówiący, że im mniej czasu użytkownik spędza w serwisie, tym lepiej świadczy to o stronie (sc. bo znalazł poszukiwaną informację i pobrał dane na własne urządzenie) staje się w obliczu obecnych aplikacji i rozwoju usług online niebywale wręcz anachroniczny. Biblioteka cyfrowa powinna zapewniać również zestaw narzędzi do pracy ze zdigitalizowanymi materiałami i ich postaciami pochodnymi (jak choćby warstwą tekstową) oraz spersonalizowaną przestrzeń dla użytkownika. Powinna tym samym stać się „biblioteką” par excellence: z „biurkiem” czytelnika-użytkownika, jego własnymi notatkami, zakładkami i wszelkimi niezbędnymi pomocami. Przestrzeń cyfrowa ułatwia to zadanie, dzięki temu POLONA daje możliwość dodawania notatek i zakładek, tworzenia własnych kolekcji oraz zarządzania dodanymi przez użytkownika treściami.

O ile możemy dążyć do wypracowania i wdrożenia optymalnego zestawu narzędzi i funkcjonalności, o tyle niemożliwe jest stworzenie pojedynczego uniwersalnego interfejsu, który będzie idealnie dopasowany do potrzeb wszystkich użytkowników. Czego innego oczekuje naukowiec przygotowujący edycję tekstu, inne narzędzia potrzebne są do wyczerpującej kwerendy w materiałach prasowych, a inne do badania ikonografii – takie przykłady, przypadki użycia i typy użytkowników można mnożyć w nieskończoność. Należałoby więc umożliwić użytkownikom personalizowanie GUI lub więcej: dać do wyboru kilka możliwości, przy jednoczesnym zachowaniu odpowiedniego przepływu i jakości danych oraz dostępu do własnych treści.

Czy zatem nowa otwartość nie powinna łączyć się już nie tylko z powszechną dostępnością zasobów, ale również z wyemancypowaniem ich z pierwotnych, predefiniowanych interfejsów? A idąc za tym pytaniem – czy w takim razie wybrany przez użytkownika interfejs nie mógłby pozwalać na pracę z dowolnym obiektem z dowolnej biblioteki cyfrowej na świecie, a słowo „otwartość” mogłoby zostać wyparte przez „interoperacyjność”?

Ta nowa idea otwartości już się pojawiła – jest to IIIF, pod tym skrótem kryje się nieco enigmatyczna nazwa International Image Interoperability FrameworkIIIF z jednej strony to konsorcjum (a wręcz „społeczność”) najważniejszych na świecie instytucji kultury oraz ośrodków akademickich i badawczych, jak choćby British Library, Bibliothèque nationale de France, Biblioteca Apostolica Vaticana, Smithsonian Institution, Oxford, Stanford, Yale, Harvard, Cambridge i – rzecz jasna – Biblioteka Narodowa. Z drugiej strony zaś, jak sama nazwa wskazuje, to platforma (framework) określająca zestandaryzowane sposoby udostępniania online obrazów (co w tym przypadku w zasadzie znaczy tyle, co „zdigitalizowanych materiałów” bądź „dziedzictwa kultury”). Poprzez zestaw API (Image, Presentation, Search, Authentication) możliwe jest również ich wielopoziomowe strukturyzowanie i łączenie z metadanymi, przeszukiwanie i określanie zasad dostępu (np. dla materiałów chronionych prawem autorskim).

Jak to wygląda w praktyce? Przykładowo, chcąc porównać kilka rękopisów z różnych źródeł, np. z Bodleian Library, BnF i biblioteki klasztoru Sankt Gallen, posługując się manifestem IIIF w formacie JSON możemy pominąć interfejs, a wręcz „obrać” materiały z warstwy GUI i wyświetlić w jednej przeglądarce Mirador. Możliwe jest też zaawansowane dostosowanie obrazu, anotowanie (przy czym obszar może być dowolnie określony przez użytkownika), a nawet nakładanie dodatkowych warstw. Znajduje to zastosowanie przy tworzeniu przestrzeni roboczych dla naukowców, scalaniu rękopisów, których fragmenty rozproszyły się po wielu instytucjach, a nawet „wklejaniu” miniatur wyciętych przez pozbawionych przyzwoitości bibliofili-wandali.

To jednak tylko drobny wycinek z oferowanych przez IIIF możliwości. Dzięki prostocie i elastyczności można budować na tej platformie rozwiązania dedykowane niewielkim projektom, eksperymentom (zasługują tu na uwagę zwłaszcza prace Biblioteki Uniwersyteckiej we Wrocławiu, bądź obsługujące wielkie zasoby cyfrowe i znajdujące zastosowanie w zaawansowanych projektach, jak choćby OMNIS. IIIF to inicjatywa bezprecedensowa, a interoperacyjność jest nowym kluczem dla szerokiej dostępności zbiorów cyfrowych.

Stajemy więc przed kolejną rewolucją w dostępie do zbiorów. W czasie prezentacji na Conference of Directors of National Libraries 2017, dyrektor Biblioteki Narodowej dr Tomasz Makowski, zapowiedział wdrożenie w POLONIE wszystkich API IIIF. POLONA stanie się więc nie tylko biblioteką w pełni interoperacyjną, która pozwoli użytkownikom na dowolne korzystanie z jej zbiorów, ale również miejscem, w którym będzie można pracować ze zdigitalizowanymi zbiorami z całego świata.

 ◊◊◊

Artykuł dofinansowano ze środków Ministra Kultury i Dziedzictwa Narodowego.

logotypy BN i MKiDN