Polona/Labs

Zbiory cyfrowe, stypendia i laboratorium w Narodowej Bibliotece Królewskiej Holandii


    Obecnie na platformie do wyszukiwania Delpher Narodowej Biblioteki Królewskiej Niderlandów (zwanej KB) znajdują się zbiory liczące ponad 100 mln stron zdigitalizowanych tekstów (książek, gazet, czasopism i innych wydawnictw), które pochodzą nie tylko z KB, lecz zostały  uzyskane od ponad 100 partnerów z całej Holandii. Wszystkie zbiory są ogólnodostępne  na platformie umożliwiającej wyszukiwanie według słów kluczowych. W wyniku negocjacji z posiadaczami praw (organizacjami zarządzania prawami) do zbiorów, możemy także udostępniać całą kolekcję dla celów badawczych. Niniejszy blog opisuje, w jaki sposób KB zorganizowała powstanie społeczności zorientowanej na korzystanie ze zbiorów cyfrowych jako danych.

    Zespół do spraw Humanistyki Cyfrowej (Digital Humanities Team)

    Gdy zaczęliśmy reklamować dostępność naszych zbiorów dla celów badawczych, szybko spostrzegliśmy, że współpraca ma kluczowe znaczenie w zakresie humanistyki cyfrowej i ogólniej – badań. Nie tylko dla naukowców korzystających z naszych zbiorów, lecz także w obrębie naszej własnej organizacji. Tak więc Zakład Zbiorów jest odpowiedzialny za tworzenie zbioru oraz dostarczanie danych za pośrednictwem Udostępniania Danych. Zakład Badań rozpoczął realizację kilku projektów z wykorzystaniem zasobów cyfrowych, takich jak projekt z wykorzystaniem techniki pozwalającej automatycznie rozpoznawać nazwy własne (Named Entity Recognition) w zdigitalizowanych gazetach oraz Laboratorium naukowe Biblioteki Królewskiej. Nawiązaliśmy współpracę i stworzyliśmy wewnętrzny zespół do spraw Humanistyki Cyfrowej składający się z trzech osób: Koordynatora do spraw Usług dotyczących Danych (który obecnie pełni rolę Kuratora Zbiorów Cyfrowych) z Zakładu Zbiorów, Doradcy do spraw Badań Cyfrowych oraz Inżyniera do spraw Oprogramowania Badawczego z Zakładu Badań.

    KB na wyjazdach

    Po ustaleniu składu naszego zespołu stwierdziliśmy, że wiele projektów, które realizowaliśmy wspólnie z badaczami, weszło w fazę realizacji dlatego, że ktoś w naszej sieci znał nas i słyszał, jak rozmawiamy na temat naszych danych. Chcieliśmy rozbudować tę sieć i podzielić się tym, co mamy i tym, co robiliśmy w ramach bardziej skoordynowanych działań. Z tego względu opracowaliśmy ulotkę i plakat i zgłosiliśmy abstrakty na kilka konferencji związanych ze zbiorami cyfrowymi z dziedziny nauk humanistycznych. Skontaktowaliśmy się również z bibliotekami uniwersyteckimi i poprosiliśmy o możliwość przedstawienia naszego zespołu oraz naszych działań. Razem przejechaliśmy całą Holandię i zbudowaliśmy naszą sieć.

    Łączenie, uczenie się i budowanie

    W miarę rozbudowy naszej sieci coraz więcej projektów zaczęło korzystać z naszych cyfrowych zbiorów. Jednakże spostrzegliśmy, że utrzymywanie kontaktu z grupami badawczymi wykorzystującymi do pracy nasze dane w sytuacji, gdy nie byliśmy oficjalnie częścią ich projektu, było dla nas trudne. Chcieliśmy także dowiadywać się więcej na temat nowych technik wykorzystywanych przez badaczy, które mogłyby wzbogacić lub ulepszyć dostęp do naszych zbiorów. Ponieważ od wielu lat KB prowadziła program stypendialny w Zakładzie Zbiorów oparty na zbiorach fizycznych, postanowiliśmy go przeprojektować i skoncentrować się na zbiorach cyfrowych i nowych technikach. Jednocześnie w Zakładzie Badań został wprowadzony podobny program pod nazwą: KB Researcher-in residence (Badacz-rezydent KB). W ramach tego programu badacze na wczesnym etapie kariery są zapraszani na okres sześciu miesięcy do pracy w Zakładzie Badań, by zajmować się zaproponowanymi przez nich projektami.

    Współpraca w ramach programów badawczych

    Istnienie dwóch oficjalnych programów współpracy: Stypendium KB oraz Badacz-rezydent KB oznaczało, że co roku realizowaliśmy trzy projekty, w ramach których mogliśmy ściśle współpracować z badaczami nad projektami badawczymi humanistyki cyfrowej, które dotyczyły także kwestii  mających znaczenie dla naszej biblioteki. Wszyscy badacze uczestniczący w tych programach zostali poproszeni o przepracowanie w bibliotece co najmniej jednego dnia tygodniowo. Oddelegowaliśmy inżyniera oprogramowania badawczego, aby w ramach tej współpracy opracował nowe oprogramowanie lub – jeszcze lepiej – dostosował istniejące dla potrzeb tych projektów. Ich realizacja umożliwiła nam poszerzenie wiedzy na temat modelowania statystycznego, technik widzenia komputerowego, wektoryzacji słów, analizy sieci, danych powiązanych i wielu innych zagadnień.

    Budowanie naszego ośrodka

    Dzięki intensywnej współpracy poszerzyliśmy wiedzę i wyłoniliśmy ambasadorów naszej biblioteki. Istniało jednak jeszcze wiele innych grup, które pracowały z naszymi zbiorami, a niektóre z nich wykonywały podobną pracę. W oparciu o nasze zbiory, przede wszystkim zasób gazet, postanowiliśmy zintegrować badaczy i poprosić ich o zaprezentowanie swoich prac nie tylko nam, lecz także swoim kolegom. W roku 2014 zorganizowaliśmy pierwszą konferencję DHBenelux, która przyniosła znaczące korzyści w postaci powstania sieci współpracy i rozpowszechniania wiedzy. Dlatego zorganizowaliśmy w KB dwie kolejne konferencje pod tytułem Newspapers as Big Data, jedną w 2015 roku, a drugą w 2017 . Stanowiły one dla nas okazję do zaprezentowania sposobu, w jaki zbudowaliśmy nasze zbiory, a także  procesów optycznego rozpoznawania znaków oraz wiedzy na temat tego, co w sposób zgodny z prawem można uczynić z danymi. Nie wspominając już o istotnym znaczeniu tych wydarzeń dla tworzenia sieci współpracy.

    Rozpowszechnianie wyników badań

    Od samego początku naszych starań w roku 2014 udało nam się stworzyć sieć badaczy zainteresowanych naszymi danymi, naszą pracą oraz możliwościami, jakie ma do zaoferowania KB jako biblioteka. Jednakże wszystkie wyniki naszych badań były publikowane jedynie na serwerze KB przeznaczonym dla celów badań oraz na naszym koncie Github. Oznaczało to, że były w pewnym sensie ukryte. Nasza strona internetowa, prowadzona na potrzeby laboratorium Biblioteki Królewskiej, nie była aktualna ani spójna z tożsamością firmową KB. Po wszystkich działaniach na rzecz zapewnienia naszym zbiorom pozycji centralnego ośrodka badań, potrzebowaliśmy platformy odpowiadającej naszym celom. Wspólnie z partnerem zewnętrznym zbudowaliśmy nową stronę internetową, na której możemy publikować dane, narzędzia, demo, nowości oraz blogi, co ułatwia nam upowszechnianie wyników. Wszystkie projekty, nad którymi pracujemy lub do współpracy nad którymi jesteśmy zapraszani, zostały zgromadzone w lab.kb.nl, stanowiąc nie tylko portfolio wykonanej przez nas pracy, lecz także  źródło inspiracji w używaniu zbiorów cyfrowych.

    Budowanie ukierunkowane na przyszłość

    Z satysfakcją możemy stwierdzić, że osiągnęliśmy zamierzone cele. Nasza biblioteka, nasze zbiory i nasz zespół są znane badaczom (przynajmniej w Holandii). Wiedzą oni także, w jaki sposób mogą nas znaleźć i skontaktować się z nami nie tylko w kwestii  projektów krótkoterminowych, lecz także dla celów większych projektów wymagających finansowania. Staliśmy się częścią społeczności badaczy w dziedzinie humanistyki cyfrowej w Holandii, nasze dane służą jako materiał wykorzystywany w badaniach, a współpraca z innymi badaczami wiele nas nauczyła. Będziemy kontynuować nasze starania w tym zakresie, lecz musimy także wyznaczyć sobie jako zespołowi nowe cele. W najbliższych latach będziemy pracować nad zapewnieniem przejrzystości naszym zbiorom cyfrowym oraz powiązanym procesom. Mamy także zamiar rozbudować naszą sieć współpracy o inne dziedziny nauki i grupy badawcze.

    Lotte Wilms kieruje Laboratorium naukowym Biblioteki Królewskiej (KB) w Hadze, Niderlandy. Ukończyła  anglistykę na poziomie BA i historię średniowieczną na poziomie MA na Uniwersytecie w Utrechcie. Obecnie  na studiach doktoranckich na Uniwersytecie w Maastrichcie. Jej badania skupiają się na roli bibliotek naukowych w humanistyce cyfrowej. W Bibliotece Królewskiej pracuje od 2008 roku, od 2013  zajmuje się humanistyką cyfrową i tworzeniem możliwości współpracy oraz budową struktur organizacyjnych pozwalających naukowcom na wykorzystanie zbiorów Biblioteki Królewskiej, ze skutecznym wsparciem ze strony Biblioteki.

    ◊◊◊

    Artykuł powstał w ramach realizacji przez Bibliotekę Narodową projektu „Patrimonium – digitalizacja i udostępnienie polskiego dziedzictwa narodowego ze zbiorów Biblioteki Narodowej oraz Biblioteki Jagiellońskiej” współfinansowanego ze środków Europejskiego Funduszu Rozwoju Regionalnego w ramach Programu Operacyjnego Polska Cyfrowa 2014-2020 oraz budżetu państwa.

    ◊◊◊

    Dofinansowano ze środków Ministra Kultury i Dziedzictwa Narodowego.