Przetwarzanie i OCR czasopism drukowanych gotykiem - krok po kroku
Posted ndz., 2010-12-05 00:14 by Tomasz Kalota
Wspólnie z Rafałem Raczyńskim i Pawłem Rękarem przygotowaliśmy opis linii technologicznej, zaprojektowanej na potrzeby digitalizacji czasopism drukowanych gotykiem. Do zilustrowania całego procesu posłużyliśmy się czasopismem Schlesische Privilegirte Staats- Kriegs- und Friedens-Zeitung, które jest jednym z najcenniejszych i najważniejszych periodyków śląskich, ukazującym się nieprzerwanie przez ponad 200 lat we Wrocławiu. Punktem wyjścia do przygotowania szczegółowych opisów poszczególnych kroków omawianej tutaj linii technologicznej jest referat i prezentacja, które również wspólnie z Pawłem i Rafałem przygotowaliśmy na konferencję Polskie Biblioteki Cyfrowe 2010.
Streszczenie referatu: Referat prezentuje krok po kroku proces przygotowania publikacji cyfrowych będących odwzorowaniem czasopism drukowanych czcionką gotycką. Tego typu materiały stanowią dosyć pokaźny zasób polskich bibliotek i w związku z tym celowym jest opracowanie metody umożliwiającej sprawne przygotowanie funkcjonalnej publikacji cyfrowej spełniającej najlepsze standardy jakościowe. Głównym celem referatu jest skonfrontowanie przyjętych schematów organizacyjnych i logistycznych oraz zastosowanych rozwiązań technicznych z metodami digitalizacji przyjętymi w innych instytucjach, zajmujących się digitalizacją i tworzeniem bibliotek cyfrowych. Autorzy referatu wyrażają przekonanie, że jednym z kluczowych czynników wpływającym na efektywność i obniżenie kosztów procesów digitalizacji jest ich automatyzacja. Niniejszy referat ma więc być zachętą do analizy poszczególnych kroków cyfryzacji obiektów bibliotecznych oraz podjęcia próby ich udoskonalania i usprawniania.
Cały proces digitalizacji materiałów bibliotecznych można podzielić na pięć etapów:
- digitalizacja
- przygotowanie plików źródłowych
- rozpoznanie tekstu - OCR
- przygotowanie plików prezentacyjnych
- publikacja w bibliotece cyfrowej
Każdy z wymienionych etapów wymaga zaprojektowania i skonfigurowania warsztatu pracy (wybór sprzętu i oprogramowania) oraz skoordynowania poszczególnych działań i zapewnienia płynności prac w wymiarze całego procesu. Autorzy referatu zaprezentują własne doświadczenia zdobyte podczas konfigurowania linii technologicznej dedykowanej dla digitalizacji czasopism drukowanych gotykiem w Bibliotece Uniwersyteckiej we Wrocławiu.
W kolejnych artykułach zostaną szczegółowo opisane etapy przygotowania gotowej publikacji do zamieszczenia w bibliotece cyfrowej. Zachęcamy do komentowania, zadawania pytań oraz do dyskusji.
- Zaloguj się, by odpowiadać
- 28430 odsłon