Digitalizacyjny workflow
Posted pt., 2016-08-05 06:22
W powyższym artykule chciałbym ukazać cykl życia skanów od wyboru materiałów, ewidencji, konserwacji, skanowania, kontroli jakości, migrację danych oraz publikację online. Tak żeby uświadomić nieuświadomionym, że położenie kartki na skanerze nie załatwia sprawy.
#DEFINICJE..
Digitalizację można określić jako "przekształcenie obiektu analogowego na obiekt cyfrowy". Jak prawie wszystko można podzielić w przyrodzie tak i digitalizację można podzielić... na digitalizację masową i selektywną. Digitalizacja masowa to zespół metod zastosowanych w celu zdigitalizowania zbioru obiektów przy eliminacji lub ograniczeniu analizy zawartości tego zbioru . Skomplikowane???... Otóż nie. Chodzi po prostu o zeskanowanie wszystkiego bez podziału na cenne lub mniej cenne podzbiory (przygotowanych lub nieprzygotowanych). Zbiór jak zbiór. Może to oznaczać kilka obiektów jaki i kilkaset... Natomiast digitalizacja selektywna polega na wybraniu konkretnych przygotowanych lub nieprzygotowanych do digitalizacji obiektów . Obie metody mogą być stosowane razem, oddzielnie lub uzupełnieniem dla jednej lub drugiej (metody). Tytułowy workflow można z grubsza podzielić na 4 główne procesy z wieloma podprocesami: planowanie digitalizacji, pre-digitalizacja, digitalizacja, postdigitalizacja.
#PLANOWANIE DIGITALIZACJI...
Cele digitalizacji
W "ochronie" zbiorów i w "udostępnianiu" zbiorów mamy zawarte dwa główne cele digitalizacji. Instytucje, które prowadzą digitalizację lub też mają taki zamiar mogą stosować różne kryteria wyboru zbiorów do cyfryzacji np. kryteria wartości historycznej, kulturowej, stanu zachowania, czy też reprezentatywności. Jeśli określi się najważniejsze kryteria wtedy można zastosować wspomnianą wyżej metodę digitalizacji masowej bądź selektywnej.
Zakres czasowy digitalizacji
Jak są cele, jest też i czas tzn. trzeba określić czy digitalizacja jest ciągła i planowa czy też jest to jednorazowy wyskok. Określając czas mamy wyjście do stworzenia harmonogramów i rozliczeń.
Outsourcing czy partnerzy
Często jest tak że dana instytucja jest za mała do prowadzenia własnej digitalizacji. Wtedy powinna poszukać partnera. To może być większa instytucja z większym doświadczeniem i budżetem lub firma, która zajmuje się masową digitalizacją. Tak zwany outsourcing jest coraz popularniejszy. Rozwiązuje wiele problemów ale też i stwarza nowe. Trzeba dobrze przemyśleć ten krok. Ogólnie pozyskanie partnera może zwiększyć szanse powodzenie projektu digitalizacyjnego.
Analizy… i harmonogramy
Przeprowadzenie analiza SWOT w danym projekcie z pewnością też ułatwi zwiększenie szans na powodzenie. Jest to bowiem uniwersalne narzędzie do planowania w projektach komercyjnych. Bardzo ważną kwestią jest stworzenie dokładnego harmonogramu ze wszystkimi etapami np. wybór sprzętu, instalacja sprzętu, szkolenie pracowników, testy, skanowanie itp. Taki harmonogram później będzie skorelowany z wynikami pracy tj. rozliczenie digitalizacji.
#PRE-DIGITALIZACJA...
Plany, wykazy i kolejki…
W małych instytucjach, które mają mały zasób planowanie "co mamy zdigitalizować i w jakiej kolejności" można pominąć. W dużych instytucjach podstawą jest plan wyboru... Bez tego się nie obejdzie. Proces ten nie tylko obejmuje selekcję materiałów archiwalnych ale i też kolejność w digitalizacji. Selekcji możemy dokonać za pomocą systemu komputerowego np. Jeśli takowego systemu nie ma, wtedy tworzymy (może być prosty formularz w excelu) lub posiłkujemy się wykazami tudzież zamówieniami obiektów/zbiorów wytypowanych do zeskanowania. Przed stworzeniem listy sprawdzamy czy wybrane obiekty/zbiory mają opis katalogowy/inwentarzowy. Jeśli nie ma takiego opisu lub jest niepełny trzeba sporządzić lub uzupełnić. Następnym krokiem jest sprawdzenie czy w przeszłości wybrane obiekty/zbiory nie zostały zdigitalizowane, jeśli tak to wtedy sprawdzamy w jakie parametry zostały użyte. W dużych instytucjach wykazy digitalizacyjne są procesem ciągłym składająca się z tzw. digitalizacji planowej (wersja digitalizacji masowej), rozpisanej wieloletnie, oraz poprzez system zamówień zewnętrznych czy też specjalnych. W systemie zamówień zewnętrznych/specjalnych najczęściej nadaje się priorytety. Dzięki temu możemy uzyskać sprawną bieżącą obsługę zleceń. Problem pojawia się w chwili gdy będziemy mieli nadpodaż pilnych lub bardzo pilnych zamówień (zwykłe zamówienia są najczęściej realizowane według dat wpływu). Wtedy powstaje korek, trudny do rozładowania.
Konserwacja
Bardzo ważną rzeczą jest sprawdzenie obiektów/zbiorów pod względem ewentualnej konserwacji, zwłaszcza tych materiałów archiwalnych, które są bardzo popularne i tym samym często są wypożyczane. Jest to o tyle ważne, że ewentualny proces konserwacji może być procesem długotrwałym i kosztownym. W tej sytuacji rozwiązaniem jest stworzenie odrębnej listy obiektów/zbiorów które mają być przeznaczone do konserwacji. Dokumentacja archiwalna, w zależności od stanu zachowania akt i rodzaju powstałych zniszczeń, powinna być poddana konserwacji zabezpieczającej, ratunkowej lub restauracji . Do konserwacji zabezpieczającej zaliczamy: właściwe przechowywanie, kontrola temperatury i wilgotności w magazynie, zwalczanie szkodników, szkolenie personelu. Natomiast do konserwacji ratunkowej zaliczamy m.in. dezynfekcję, odkwaszanie papieru. Restauracja odnosi się do pojedynczego obiektu. Polega na zachowaniu historycznej wartości poprzez uzupełnienie czy też scalanie kolorystyczne (retusz i rekonstrukcja).
Metadane
Bez dobrych metadanych nie ma dobrej digitalizacji. Krótko mówiąc metadane to dane o danych . Metadane można podzielić na:
• administracyjne (informacje dotyczące lokalizacji, gromadzenia)
• opisowe (narzędzia wyszukiwawcze, indeksy)
• strukturalne (relacje między obiektami i ich elementami)
Wszystkie te typy metadanych muszą należycie charakteryzować dany dokument tak aby użytkownik mógł zrozumieć m.in. jego zawartość, źródło pochodzenia, warunki wykorzystania. Obecnie jest wiele standardów opisów, należy wspomnieć o Dublin Core Metadata Element , EAD , ISAD(G) , MARC21 , METS .
Podział zadań
Właściwy podział zadań w zespole digitalizacyjnym jest istotny we względu na wspomniany workflow. W zespole każda osoba ma przypisany zakres zadań. Kogo można wymienić??? Po pierwsze mamy koordynatora/kierownika, który nadzoruje etap planowania i realizacji. Ważnym stanowiskiem jest osoba kustosza , która to powinna zaplanować wyborów zbiorów do digitalizacji, nadać priorytety etc.. W zespole można też wyróżnić osoby które dają wsparcie dla digitalizacji i osoby, które bezpośrednio biorą w tym udział. Do wsparcia można zaliczyć konserwatora i informatyka (nadzór nad sprzętem, oprogramowaniem, tworzeniem kopii bezpieczeństwa, administracja nad systemem). W samym procesie możemy wyróżnić osoby które dokonują selekcji pod kątem digitalizacji i kierowaniem materiałów archiwalnych do konserwacji, osoby które mają za zadanie przygotować opisy, metadane, osoby, które skanują, osoby które sprawdzają jakość skanów, aż wreszcie do osób, które zajmują się publikacją online. To rozbudowana wersja, stan idealny, do którego należy dążyć. Bardzo często jest tak, że osoba która przykładowo skanuje odpowiada też za opisy czy też weryfikację skanów.
#DIGITALIZACJA
Znowu plany… i problemy…
Jak już wcześniej wspomniałem same skanowanie powinno odbywać się na podstawie planów digitalizacyjnych. Plany mogą się różnić od planów, które były tworzone na etapie pre-digitalizacji. Najczęściej nie ma dużych różnic. Plany, zamówienia, na których odbywa się digitalizacja są najważniejszymi dokumentami, z których jest później rozliczana praca. Zazwyczaj plany są od-do. Po zatwierdzenia takich planów zazwyczaj nie ma możliwości dowolnego przesuwania. Zamówienia też mają swoje prawa, które określa przede wszystkim data wpływu oraz nadane priorytety. Przy nad podażu pilnych/bardzo zamówień pojawiają się problemy. Jeśli dana instytucja prowadzi digitalizacje usługową zamówienia mogą przyblokować digitalizację planową. Trzeba też brać pod uwagę inne sytuacje kryzysowe np. awaria sprzętu, aktualizacja oprogramowania, nadmierna absencja pracowników.
Transport
Ważna kwestia w momencie, gdy magazyn w którym znajdują się wytypowane materiały do skanowania znajduje się w innej lokalizacji niż pracownia digitalizacyjna. Wtedy należy zapewnić bezpieczeństwo w czasie transportu . Należy sprawdzić przed i po rozpakowaniu materiałów stan fizyczny. Każdy transport, odbieranie i przekazywanie materiałów archiwalnych powinien opierać się na protokołach zdawczo-odbiorcze.
Konserwacja
W pracowni digitalizacyjnej materiały archiwalne powinny być już opracowane pod względem merytorycznym i konserwatorskim. To stan idealny, chyba rzadko spotykany. Często jest tak, że to właśnie skan obiektu, który jest w złym stanie technicznym jest początkiem właściwej konserwacji. Takie obiekty przy skanowaniu jeszcze bardziej się niszczą. Trzeba być wtedy bardzo ostrożnym.
Skanowanie
Skanowanie to nie tylko włączenie skanera/aparatu, położenie danego dokumentu i naciśnięcie przycisku skanuj. Aby uzyskać wierne odwzorowanie obiektu należy wdrożyć color management . Pod tym pojęciem kryje się cała gama wymagań. Podstawą jest kalibracja sprzętu oraz stworzenie profili. Powinny być kalibrowane zarówno monitory jak i skanery. Kalibrację powinno przeprowadzać w miarę często. Niektóre modele skanerów, monitorów mogą się kalibrować automatycznie. Skanery tak jak materiały archiwalne powinny być często czyszczone z kurzu i pyłów codziennie. Każdy skaner na swój cykl eksploatacyjny. Po zakończeniu takiego cyklu trzeba zamówić pełny przegląd czasami połączony z konserwacją sprzętu u producenta lub u autoryzowanego dystrybutora. Wtedy trzeba mieć na uwadze, aby sprzęt w pracowni należał do jednej marki. Wtedy koszty eksploatacyjne będą mniejsze.
Kontrola jakości
Kontrolowanie jakości odbywa się na każdym etapie digitalizacji. Pierwszą kontrolę wykonuję skanerzysta. Widzi on na bieżąco czy skany zawierają jakiś defekt. Drugą kontrolę powinien wykonywać osoba zajmująca się tylko kontrolą skanów. Musi sprawdzić wszystkie szczegóły: kolor, paginację/foliację, fakturę. Kontrola najlepiej wykonywać porównując skany z oryginałem. Kontrola jakość i ewentualne poprawki zajmują dużo czasu ale są niezbędne aby cały proces miał sens. Czasami można skontrolować określoną partię materiału np. 20-30%.
#POSTDIGITALIZACJA
Przetwarzanie plików cyfrowych
Wynik tych wszystkich procesów zamyka się w dziesiątkach lub setkach plików cyfrowych. Wyróżniamy cyfrowe kopie archiwalne i kopie użytkowe. Kopia archiwalna to kopia o zapisie bezstratnym, najczęściej jest to format TIFF w wysokiej rozdzielczości (od 300do 600 dpi). W przypadku aparatów cyfrowych będzie to format RAW . Kopie użytkowe są tworzone z formatu bezstratnego. Najczęściej jest to JPG (w archiwach) lub DjVu (biblioteki cyfrowe). Używane są najczęściej do publikacji online. Jeśli oryginał jest mało czytelny to i skan będzie taki sam. Wtedy zaleca się zmianę jasności lub kontrastu aby wydobyć treść. Ważne jest to przy tworzeniu OCR . Innymi modyfikacjami w plikach są kadrowanie, obrót, dodanie znaku wodnego.
Archiwizacja plików cyfrowych
W obecnych czasach głównym problemem staje się długotrwałe przechowywanie cyfrowych danych. Archiwizację można przeprowadzić na kilka sposobów:
• archiwizacja na dyskach komputerowych
• archiwizacja na nośnikach optycznych
• archiwizacja na macierzach dyskowych
• archiwizacja na nośnikach taśmowych.
Najtańszą i najbardziej dostępną opcją jest archiwizacja na dyskach komputerowych i na płytach CD/DVD. Problemem jest mały czas życia takich dysków czy standardowych nośników optycznych. Specjalne wersje dysków optycznych mają ponoć trwałość do 100 lat . Innym problemem jest też ograniczona pojemność. Obecnie zaleca się stosowanie macierzy dyskowej lub bibliotek taśmowych.
Udostępnienie plików cyfrowych
Udostępnianie zbiorów cyfrowych w Internecie jest regulowane ustawowo . Pamiętać należy o kwestiach prawno-autorskich (zainteresowanych odsyłam do ustawy). Najważniejsze jest to by każdy zbiór powinien być udostępniany w formie najbardziej atrakcyjnej dla odbiorcy tj. format: JPG, PDF, warstwy tekstowe, metadane. Serwis internetowy, na którym będą prezentowane cyfrowe zbiory powinien mieć pełną możliwości wyszukiwania tekstu, sortowania czy też indeksowania. Trzeba pamiętać, że w internecie są publikowane materiały, które są opracowane, i do których dana instytucja na pełne prawa. Zbiory chronione prawem autorskim, które są zdigitalizowane można wyłącznie przeglądać w terminalach danej instytucji.
#PODSUMOWANIE
Najczęściej digitalizację wyobrażamy sobie tak: mamy "coś" do zeskanowania --> skanujemy to "coś" --> wynikiem skanowanie jest plik cyfrowy (który jest poddawany najczęściej obróbkom cyfrowym). NA pierwszy rzut oka jest to prosty proces. W rzeczywistości ten workflow digitalizacyjny jest bardziej skomplikowanym wieloetapowym procesem jak wyżej zaprezentowałem zwięźle główne elementy digitalizacji. Wiele istotnych rzeczy pominąłem ze względu na charakter pracy, a zainteresowanych odsyłam do licznej literatury, w której opisana kwestia jest bardzo szczegółowo podana.
- Zaloguj się, by odpowiadać
- 13054 odsłony