Polona/Labs

Jednym z głównych celów digitalizacji jest umożliwienie użytkownikom dostępu do zgromadzonych w bibliotekach zasobów drukowanych z każdego miejsca na świecie, bez potrzeby wychodzenia z domu.

Digitalizacja odbywa się na różnych poziomach szczegółowości. W małych instytucjach wszystkie czynności związane z tym procesem mogą wykonywać 1-2 osoby. W większych może być zaangażowanych nawet kilkadziesiąt i więcej osób. Dlatego pierwszym krokiem przed przystąpieniem do pracy jest zaplanowanie całego procesu technologicznego i odpowiedzialności za poszczególne zadania.

W praktyce jest to bardzo trudne, ponieważ trzeba uwzględnić szereg oczekiwań, problemów i barier, które często pomimo przygotowania nawet najbardziej dopracowanych planów towarzyszą cały czas pracownikom zajmującym się digitalizacją.

Sam proces digitalizacji może wydawać się czynnością bardzo prostą. Polega na przetworzeniu dokumentu z formy analogowej na cyfrową. W przypadku druku jest to zrobienie zdjęcia lub skanu za pomocą aparatu cyfrowego lub skanera i zapisanie go na dysku. W przypadku dokumentów dźwiękowych (muzyka, książka mówiona – audiobook) jest to przetworzenie sygnału analogowego na sygnał cyfrowy za pomocą oprogramowania zainstalowanego na komputerze. Dźwięk nagrany na płycie gramofonowej, taśmie magnetycznej itp. odtwarza się na magnetofonie szpulowym lub kasetowym podłączonym do komputera. Odtwarzanie odbywa się w czasie rzeczywistym. Na komputerze zainstalowane jest oprogramowanie, którego zadaniem jest przetworzenie dźwięku z formy analogowej na sygnał cyfrowy i zapisanie go. W przypadku filmów proces digitalizacji przebiega podobnie jak przy dokumentach dźwiękowych. Różnice polegają na użyciu innego oprogramowania i dodatkowo karty TV do przechwytywania obrazu i dźwięku.

Jak widać, digitalizacja na podstawowym poziomie jest to dość prosta czynność, którą można wykonać w warunkach domowych, mając oczywiście odpowiedni sprzęt. Na niewielką skalę właściwie każdy może przeprowadzić digitalizację własnych zbiorów i nie musi to być bardzo kosztowne. Jednak w instytucji, gdzie planowane jest masowe zabezpieczenie i udostępnienie zbiorów online, proces ten będzie bardziej skomplikowany, czasochłonny i kosztowny.

W tym artykule skupię się na opisaniu masowego procesu digitalizacji dokumentów papierowych. Posłużę się przykładami z własnych doświadczeń związanych z pracą nad projektami: Jagiellońska Biblioteka Cyfrowa (JBC)Patrimonium – digitalizacja i udostępnienie polskiego dziedzictwa narodowego ze zbiorów Biblioteki Narodowej oraz Biblioteki Jagiellońskiej (Patrimonium)  i kilkoma innymi, w których brałem udział.

Główna strona Jagiellońskiej Biblioteki CyfrowejGłówna strona Jagiellońskiej Biblioteki Cyfrowej

 

Główna strona cyfrowej Biblioteki Narodowej POLONA.Główna strona cyfrowej Biblioteki Narodowej POLONA.

Proces digitalizacji rozpoczyna się od typowania dokumentów. W realizowaniu różnego rodzaju projektów bierze się pod uwagę wiele czynników m. in.: profil zbiorów, stan zachowania, wartość dydaktyczną lub naukową, znaczenie dla miejscowości, regionu, kraju, przydatność dla użytkownika. Przy digitalizacji masowej dobór obiektów nie jest aż tak szczegółowy, ponieważ celem jest archiwizacja i cyfrowe udostępnienie jak największej części posiadanego zasobu. Ograniczenia mogą być tutaj głównie finansowe.

W pierwszej kolejności do digitalizacji wybiera się zbiory najbardziej cenne oraz zagrożone zniszczeniem zniszczone. Wersja cyfrowa umożliwia ograniczenie udostępniania najbardziej wartościowych dla kultury dokumentów, które w trakcie użytkowania mogłyby ulec uszkodzeniu oraz na uratowanie treści druków. Materiały biblioteczne wydawane w XIX i XX wieku podlegają degradacji spowodowanej stosowaną wówczas technologią oraz warunkami przechowywania, udostępniania i zanieczyszczeniami środowiska zewnętrznego.  Zagrożenie ze strony „kwaśnego papieru” dla zbiorów bibliotecznych nazwano cichą katastrofą chemiczną. Jedynym zabiegiem konserwatorskim, ratującym ich fizyczne przetrwanie jest odkwaszenie, które zatrzymuje proces destrukcji, a digitalizacja umożliwi udostępnianie zbiorów z tego czasu – wyłącznie w postaci cyfrowej.

Cały proces digitalizacji masowej w instytucji wspierany jest przez oprogramowanie kontrolujące przebieg poszczególnych zadań, które ułatwia zarządzanie i wspiera podejmowanie decyzji. Może to być realizowane przez jeden system (np. POLONA – Repozytorium Cyfrowe Biblioteki Narodowej – RCBN) lub więcej systemów jednocześnie (np. Jagiellońska Biblioteka Cyfrowa – Dlibra i System Obsługi Jagiellońskiej Biblioteki Cyfrowej – SOJBC).

 

System Obsługi JBCInterfejs systemu obsługi JBC, działającego lokalnie w Bibliotece Jagiellońskiej

 

4Repozytorium Cyfrowe Biblioteki Narodowej

W kolejnym etapie digitalizacji dokumenty z magazynu lub z innego miejsca przechowywania trafiają do opracowania. Na podstawie oryginału do katalogu komputerowego biblioteki wprowadzany jest opis bibliograficzny. Następnie metadane importowane są do systemu zarządzającego procesem digitalizacji. Tam bezpośrednio nanoszone są dodatkowe informacje techniczne o dokumencie m.in.: opis braków, opis uszkodzeń, stan zachowania, wymiary itp. Jest to bardzo przydatne pracownikom realizującym poszczególne zadania w procesie digitalizacji.

Po opracowaniu dokument przewożony jest do pracowni reprograficznej, gdzie jest skanowany i jego kopia cyfrowa zapisywana jest na macierzach dyskowych.

Obecnie do skanowania zbiorów specjalnych i dokumentów wielkoformatowych używane są profesjonalne aparaty fotograficzne lub skanery dziełowe, które to gwarantują wysoką jakość wynikowych fotografii i skanów oraz bezpieczeństwo skanowanego dokumentu (m. in. użycie zimnego światła w trakcie naświetlania nie powoduje nagrzewania skanowanego dokumentu, a krótki czas naświetlania pozwala na zmniejszenie zagrożenia związanego z negatywnym oddziaływaniem światła). Istotna jest także ich niska awaryjność.  Ich głównym minusem jest bardzo wysoka cena. Dawniej uważano, że alternatywą może być używanie skanerów płaskich, jednak nie nadają się one do masowej digitalizacji dokumentów zwłaszcza o dużych formatach i bardzo cennych ze względu na możliwość ich uszkodzenia (dokument trzeba za każdym razem obracać i układać na skanerze oraz dociskać klapą).

Kolejnym etapem digitalizacji są trzy procesy, które często odbywają się równolegle: archiwizacja kopii cyfrowej, konserwacja oryginału i obróbka cyfrowa kopii dokumentu.

Profesjonalna archiwizacja realizowana jest na macierzach dyskowych i taśmach magnetycznych zarządzanych przez biblioteki taśmowe. Cyfrowe kopie archiwalne dokumentu wykonuje się w więcej niż jednym egzemplarzu i przechowuje w formacie bezstratnym (np. TIFF, RAW) w co najmniej dwóch niezależnych od siebie lokalizacjach. W zależności od przyjętych rozwiązań kopia cyfrowa zapisywana jest na dysku, taśmie lub jednocześnie na obu nośnikach.

Równolegle do archiwizacji cyfrowej, jeżeli oryginalny dokument tego wymaga, wykonuje się konserwację. Zabezpieczenie dokumentu może być też wykonane przed skanowaniem w przypadku gdy istnieje obawa, że dokument mógłby zostać nieodwracalnie uszkodzony w trakcie digitalizacji.

O ile wersje archiwalne nie powinny podlegać obróbce zmieniającej ich zawartość, to w celu udostępnienia użytkownikom kopii dokumentu w formie lepiej odpowiadającej ich potrzebom, można poddać ją obróbce cyfrowej za pomocą programów do edycji grafiki rastrowej. Głównym celem jest przygotowanie dokumentu do udostępnienia użytkownikom online lub lokalnie. Obróbka polega na poprawieniu jakości graficznej i wizualnej skanów, rozpoznaniu tekstu (ang.: OCR – Optical Character Recognition) oraz konwersji na formaty prezencyjne (PDF, JPG, PNG itp.). Wykonuje się to różnymi programami płatnymi i bezpłatnymi. Do najczęściej używanych należą: Adobe Photoshop, Corel PHOTO-PAINT, Scan Tailor, Abby FineReader, XnView, Adobe Acrobat, Gimp. Technika obróbki cyfrowej różni się w zależności od typu dokumentu. Sposoby przygotowania do udostępniania kopii cyfrowych starodruków i rękopisów, map czy grafik różnią się od sposobów przetwarzania książek lub czasopism. Jest to jednak temat na odrębny artykuł, ponieważ nie da się opisać tej tematyki w kilku zdaniach.

Po przygotowaniu pliku do udostępnienia można wykonać dodatkowe zabezpieczenie kopii na mikrofilmie. Jednak jest to proces bardzo kosztowny i rzadko stosowany, choć zaletą mikrofilmów jest trwałość.

Następnym, a zarazem końcowym etapem digitalizacji jest udostępnienie plików prezencyjnych na portalu biblioteki cyfrowej. Polega to na imporcie skanów do systemu zarządzania udostępnianiem, dodaniu metadanych i przydzieleniu ich do kolekcji, w których mają być docelowo wyświetlane. Ten etap digitalizacji może się różnić kolejnością wykonywanych zadań w zależności od używanego oprogramowania.

 

Proces technologiczny digitalizacji w Bibliotece JagiellońskiejSchemat procesu technologicznego masowej digitalizacji w Bibliotece Jagiellońskiej. W poszczególne zadania procesu zaangażowani są pracownicy wszystkich oddziałów biblioteki. Analizując schemat można zauważyć linię przerywaną, która obejmuje zadania wykonywane bezpośrednio w systemie zarządzającym udostępnianiem. 

Artykuł pozwala na zapoznanie się z jednym ze sposobów organizacji masowego przetwarzania i publikowania kopii cyfrowych. Opisany tutaj proces może różnić się sposobem wykonania lub kolejnością realizowanych zadań w zależności od instytucji, w której digitalizuje się zbiory. Analizując rysunek 5. można zauważyć, że proces jest bardzo pracochłonny, długotrwały i kosztowny. Przygotowanie jednej kopii cyfrowej dokumentu może trwać od jednego do nawet siedmiu dni. Nadrzędnym jednak celem digitalizacji, który przyświeca wszystkim, którzy biorą w niej udział, jest długoterminowe zabezpieczenie najcenniejszych i ważnych dla kultury dokumentów oraz udostępnienie jak największej liczby zasobów szerokiemu gronu użytkowników online. 

 ◊◊◊

Artykuł dofinansowano ze środków Ministra Kultury i Dziedzictwa Narodowego.

logotypy BN i MKiDN