Polona/Labs

Використання шаблонів для оцінки якості оцифрування


  Процес достовірного оцифрування полягає у фотографуванні кожного об’єкта з кольоровим зразком, щоб у майбутньому можна було звірити кольори за допомогою новітнього програмного забезпечення, створити з RAW-файлу ще кращий придатний для використання файл, наприклад, TIFF чи JPEG, або зберегти результати у нових форматах MXF чи JPEG 2000. У Польщі цей вид оцифрування (під яким я маю на увазі фотографування та використання шаблонів і програмного забезпечення) впроваджується в кількох культурних установах, зокрема в Національній бібліотеці, Національному музеї та Музеї історії фотографії у Кракові, Королівському замку та Варшавському музеї у Варшаві, Музеї архітектури у Вроцлаві, Сілезькому музеї в Катовіце та Національному музеї в Гданську.

  Повертаючись до основних питань, які порушувалися під час дискусій, проведених фахівцями, можна одразу зазначити, що описаний вище workflow наразі є недосяжним через нестачу фінансових ресурсів. Тоді виникає питання: як оцифровувати?

  Мета багатьох установ – зробити свої ресурси доступними онлайн в якомога коротші терміни. Тому кількість оцифрованих колекцій має важливе значення. Коли конкретна установа не має у своєму розпорядженні інструментів перевірки якості, необхідно розглянути сенс сканування у TIFF-файли, які через запис даних без втрат створюють великі файли порівняно з RAW-файлами. Їхній розмір не економить місце на диску для архівування; крім того, ці файли не зберігають якість, оскільки зроблене сканування неможливо перевірити іншим способом, окрім візуальної оцінки. Додатковим фактором при оцифруванні негативів є проблема „оригінального” позитивного відбитка – тобто, що мав на увазі автор, який відбиток він би прийняв за оригінал? При скануванні негативів ми можемо говорити лише про інтерпретацію зображення з негатива. Кожен сканер, кожен фотограф намагатиметься по-різному налаштувати контраст, насиченість та інші параметри. Негатив – це запис, який не містить жодних даних, що дозволили б об’єктивно перетворити його на позитивне зображення. Тільки цифровий запис у вигляді негативу (запис у RAW-файл з зразком) дозволяє створити достовірну цифрову копію негативу. Це повністю безпечний процес, призначений для глибокого архівування цінних музейних предметів.

  Отже, якщо кожне позитивне зображення є авторською інтерпретацією сканериста (а не автора фотографії), то що робить можливим збереження сканів у форматі TIFF? Одержувача, який отримує доступ до колекції через Інтернет, більше цікавить зміст фотографій, ніж точна копія оригіналу – до того ж, він жодним чином не може оцінити, не кажучи вже про перевірку, автентичність за оригіналом.

  Така перевірка можлива лише за допомогою шаблонів і програмного забезпечення. Кольорове відображення визначається шляхом обчислення різниці (Delta E) між значеннями кольору полів оригіналу та значеннями, зчитаними зі скану, що містить зображення цього оригіналу. У випадку FADGI 4 STAR середнє значення Delta E не повинно бути вищим ніж 3, у випадку найвищого рівня METAMORFOZE – нижчим ніж 4.

  Іншим важливим параметром є необхідна роздільна здатність. У випадку FADGI 4STAR це 400ppi, у FADGI 3STAR – 300ppi. Ці вимоги та способи їх перевірки були визначені з урахуванням потреби в надійних калібраторах і програмному забезпеченні для проведення об’єктивних вимірювань. Колишній дослідник Kodak Дон Вільямс керує компанією ISA (Image Science Associates), яка виготовляє необхідні зразки та програмне забезпечення для автоматичного аналізу параметрів, що вимагаються FADGI, та виправлення помилок.

  Повертаючись до Наказу директора Державного архіву, можемо констатувати, що таблиці в Додатку 8 до Наказу (так звані зразки стрічок) не містять інформації, надзвичайно важливої для оцінки якості проведеного оцифрування: їхні кольорові поля не мають надрукованих колірних координат, тож не очевидно, як їх оцінювати. На колірних таблицях ISA значення кожного поля наведені відповідно до схеми Lab. Це дає змогу перевірити колір у будь-який час, навіть через десятиліття. Знаючи колірні координати оригінальних зразків таблиць, можна виміряти зразок на скані і перевірити якість передачі кольору в будь-якому калькуляторі Delta E. Таблиці компанії також містять функції для вимірювання роздільної здатності і різкості оцифровувального обладнання. Еталони стрічок, перелічені в додатку до Постанови, не мають цих даних.

  Для таблиць компанії ISA створена спеціальна програма для проведення вимірювання значень параметрів на сканах, яка автоматично перевіряє якість виготовленої цифрової копії. Нижче наведено приклад того, як виглядає графічний звіт про оцінку правильності передачі кольору та яскравості порівняно з оригіналом:

  Відсутність аналогічного програмного забезпечення та невикористання тестових таблиць під час оцифрування не дає змоги перевірити, що зроблені скани дають правильне відображення оригіналів.

  На мою думку, в установах, що здійснюють оцифрування, слід запровадити оцінку змісту колекцій, які слід розділити на 2 категорії. До першої категорії можна було б віднести матеріали, призначені для публічного доступу в Інтернеті. У цьому випадку технічні рекомендації мають обмежуватися автоматичними налаштуваннями відкаліброваних сканерів і збереженням результатів оцифрування лише у стиснутих так званих легких файлах, таких як JPEG або JPEG 2000.

  Друга категорія – це глибоке архівування найцінніших колекцій, що здійснюється за високими стандартами (збереження RAW-файлів з 16-бітною глибиною кольору, використання відповідних шаблонів і збереження звітів про виконану роботу з інформацією про показники Delta E і MTF).

  Якщо найцінніші колекції можуть обчислюватися тисячами, а не мільйонами об’єктів, варто розглянути можливість створення мобільного пакету для потреб польських архівів, який можна буде використовувати для оцифрування найцінніших колекцій. Пропозиція провести оцінку колекцій стосується лише об’єктів наступних типів: негативи, фотографічні відбитки, карти, графіка та плоскі об’єкти.  Мікрофільми, зважаючи на їхній переважно файловий зміст, не потребують точного відтворення, наприклад, кольору паперу.

  Ще одне важливе питання, яке виникає в дискусіях, – це час роботи зі сканером. Я переконаний, що людина, яка працює із зображеннями, не може працювати над завданнями, безпосередньо пов’язаними з оцінкою якості, більше 4 годин на день. Це пов’язано з візуальним сприйняттям і природною втомою зору. З цієї причини в постпродукції кінозображень існує емпіричне правило: колорист у постпродукції повинен працювати не довше 4 годин. Після цього часу він не може розрізняти колірні нюанси і втрачає точку відліку. Тому після максимум 4 годин, проведених за монітором комп’ютера, сканерист зможе обробляти відсканований матеріал і займатися підготовкою наступних колекцій до оцифрування.

  У Наказі слід запровадити окремі розділи про підготовку архівних матеріалів відповідно до типу колекції – немає потреби всім читати про пагінацію та фоліацію, коли вони сканують лише негативи. Також мають бути розділи з рекомендаціями, інструкціями та розпорядженнями щодо фотографій, аудіовізуальних матеріалів (як на плівці, так і на магнітній стрічці), звукових матеріалів та документації справ. Також має бути розділ, що чітко визначає, як оцінювати зміст і важливість архівних матеріалів з точки зору запланованого оцифрування. Хто може дати категорії для підготовки матеріалу до „швидкого” оцифрування та оцифрування, де акцент робиться на якості та проведенні його відповідно до прийнятих стандартів високої достовірності.

  Я б не побоявся сканувати більше одного разу, тобто провести сканування всіх негативів за короткий проміжок часу з метою оцінки змісту матеріалу, а потім відібрати найцінніші роботи для якісного оцифрування, щоб отримані файли можна було використовувати в публікаціях, на виставках тощо. Якщо деякі архівні матеріали є надто тендітними для проведення двох оцифрувань, слід провести оцінку оригінального матеріалу і визначити якість оцифрування.

  Виходячи за рамки цього тексту, оцифрування плівки є дуже складним і дорогим процесом. Він вимагає дуже дорогого обладнання (витрати оцінюються в мільйони злотих), вузькоспеціалізованих знань і участі кваліфікованих фахівців. З огляду на це, рішенням могло б стати створення центрального архіву для оцифрування аудіовізуальних матеріалів, який би виконував цей вид робіт. Оцифрування аудіовізуальних матеріалів включає також матеріали з магнітних носіїв, таких як VHS, BETACAM тощо. Виходячи з моїх знань, отриманих під час участі професіоналів в обговоренні, я не бачу необхідності у високій якості запису. Вважаю, що цілком достатнім є запис у роздільній здатності HD (1920×1080) у кодеку mp4 (стандарт, що використовується на інтернет-каналі Youtube) – він є з втратами, але переваги від зменшення об’єму кінцевого файлу є значними. Немає необхідності створювати великі файли із записом без втрат (DPX) або з низьким ступенем стиснення (PRORES 444 та інші). Наскільки мені відомо, оцифровуванням відзнятого матеріалу займаються переважно зовнішні компанії, скануванням часто здійснює TVP.

  Серед інших питань, пов’язаних з оцифруванням, я, як фахівець у галузі фотографії та кіно, повинен звернути увагу на питання, порушені в Наказі в Главі 4 та Додатках 1 і 2: положення параграфу 10(2)(2) вказують на використання постійного світла, а не спалаху, що вказує на намір усунути світло спалаху. Незрозуміло, що є причиною цього, можливо, занепокоєння щодо впливу сильного світла на безпеку об’єктів (незалежно від того, чи йдеться про ультрафіолетове випромінювання, чи про інші міркування). Однак на ринку існують системи, які гарантують повторюваність експозицій і усунення УФ-випромінювання, а їхні переваги переважають ризики, і їх не слід виключати з використання.

  „Цифрова зразкова копія”, як описано в Постанові, не відповідає вимогам „зразковості”, оскільки файл, який не містить зразку, що дозволяє перевірити програмне забезпечення значень Delta E і MTF, збережений у форматі, відмінному від 16-бітового RAW, не дозволяє об’єктивно оцінити файл або внести корективи в „цифрову розробку” до таких форматів, як TIFF або JPEG. Збереження файлів у форматах без втрат, які не відповідають поняттю справжньої зразкової-копії, на мою думку, не має сенсу.

  Що стосується записів у Додатку 1, можна припустити, що оцифрування для так званого класу 2 має здійснюватися лише в колірному просторі sRGB. Роздільна здатність має становити 600 ppi, файли слід зберігати зі стисненням з глибиною вісім біт на канал (24-розрядні файли). Справжні зразкові-копії, оцифровані у найвищій якості, повинні бути записані у максимально широкій гамі, наприклад, PROPHOTO RGB, і збережені у файлах з глибиною 16 біт на канал. У випадку негативів для оцінки змісту матеріалу достатньо роздільної здатності 2400ppi, при остаточному оцифруванні вона повинна бути значно вищою, із записом у файл із втратами. У випадку з мікрофільмами я не бачу необхідності збереження у форматі TIFF, насамперед тому, що на високошвидкісних сканерах обладнання не здатне ефективно працювати через швидкість запису. Такі файли слід зберігати з вищою роздільною здатністю, але у форматах із втратами.

  Положення Додатку 2 щодо представлення відтінків не враховують, що неможливо працювати з тонкими градієнтами, відтінками, якщо комп’ютер не обладнаний відеокартою, яка нативно працює в 10-бітному кольорі. Більшість моніторів є 8-бітними і не можуть відображати зображення без видимих артефактів (так званих нерівностей у градієнтах). Дуже важливо, щоб комп’ютер на робочому місці оцифровування був оснащений відеокартою, яка підтримує 30-бітну глибину кольору (по 10 біт на колірний канал).

  Для створення профілю недостатньо шаблону типу ColorChecker з 24 полями, а потрібен шаблон з більшою кількістю полів (наприклад, Color Checker Digital SG з 140 полями). Водночас я хочу підкреслити, що створення профілю DNG не є найкращим рішенням. Рекомендується використовувати профіль ICC, який ви вмикаєте у своєму програмному забезпеченні для перетворення файлу з RAW в інші формати. Використовуючи ICC-профіль, отримані зображення можна перевірити в програмному забезпеченні для перевірки та оцінки кольоропередачі з отриманням результату в Delta E. У ньому має бути зазначено, які шаблони є прийнятними і для чого вони призначені (з такими примітками, як: шаблон X можна перевірити в програмному забезпеченні Y, рекомендується використовувати шаблон X для високоякісної роботи, щоб мати можливість констатувати досягнення певного рівня Delta E відповідно до стандарту Z і сформувати звіт для NAC для документації, розміщеної в цифровому репозиторії, наприклад, в ZoSIA).

  Висновки та рекомендації:

  • розробити фінансову стратегію на найближчі роки, враховуючи невідкладну потребу в заміні старого обладнання, яке є занадто повільним і не дозволяє проводити оцифрування запланованими темпами та з достатньою якістю
  • забезпечити кожну установу необхідним обладнанням та спроможністю оновлювати техніку (жорсткі диски, нове обладнання для оцифрування, монітори, комп’ютери, оскільки всі ці пристрої піддаються натуральному процесу експлуатації)
  • у випадку архівів (і, можливо, інших культурних установ), створення комісій з оцінки матеріалів, щоб мати можливість відокремити найцінніші матеріали для оцифрування відповідно до найвищих стандартів, запровадження двох стандартів оцифрування: один вищий (наприклад, відповідно до рівня FADGI 4STAR), інший „швидкий” із записом даних у файлах зі стисненням із втратами
  • розробка польського стандарту для оцифрування (включно з виробництвом шаблонів та програмного забезпечення)
  • створення мобільного комплекту для оцифрування архівів
  • запровадження 4-годинного обмеження часу роботи за монітором для осіб, які працюють над оцифруванням ( сканувальників та фотографів)
  • опис та запровадження в архівах описів процедур оцифрування, включаючи підготовку матеріалів для фото-, кіно- та відеозйомки, аудіо- та файлових матеріалів
  • розглянути можливість спеціалізації центрів на національному рівні відповідно до їхніх ресурсів.

  Наслідком цього буде створення центрів, що спеціалізуються на оцифровуванні фотографій або оцифровуванні певних видів матеріалів, наприклад, карт, що спричинить за собою закупівлю спеціалізованого обладнання для окремих центрів

  ◊◊◊

  Ця стаття написана в рамках реалізації Національною бібліотекою проекту „”Patrimonium” – оцифрування та доступ до польської національної спадщини із зібрань Національної та Ягеллонської бібліотек”, що співфінансується Європейським фондом регіонального розвитку в рамках Операційної програми „Цифрова Польща 2014-2020” та державним бюджетом.

  ◊◊◊

  Співфінансовано за підтримки Міністра Культури та Національної Спадщини

  Zobacz także