Skip to main content

Instalacja Tesseract 3.0 na Ubuntu server 10.10

Instalacja Tesseract 3.0 na Ubuntu server 10.10 - Tesseract to aplikacja służąca do automatycznego rozpoznawania tekstu (ang. Optical Character Recognition, OCR). Pierwotnie była ona rozwijana przez firmę Hewlett Packard. W 2005 roku kod aplikacji został uwolniony na licencji Apache. W chwili obecnej jego rozwój jest wspierany przez Google. We wrześniu 2010 opublikowano wersję 3.0, obok wielu innych nowych funkcji oferuje on również wsparcie [...] [Zespół Bibliotek Cyfrowych]

Adam Dudczak z PCSS opisał swoje doświadczenia z aplikacją Tesseract wspieraną przez Google. To narzędzie może być barzdo przydatne przy organizacji linii technologicznej uwzględniającej rozpoznawanie tekstu w digitalizaowanych publikacjach.

Facebook Comments Box