Instalacja Tesseract 3.0 na Ubuntu server 10.10
Posted pon., 2011-01-31 16:55 by Tomasz Kalota
Instalacja Tesseract 3.0 na Ubuntu server 10.10 - Tesseract to aplikacja służąca do automatycznego rozpoznawania tekstu (ang. Optical Character Recognition, OCR). Pierwotnie była ona rozwijana przez firmę Hewlett Packard. W 2005 roku kod aplikacji został uwolniony na licencji Apache. W chwili obecnej jego rozwój jest wspierany przez Google. We wrześniu 2010 opublikowano wersję 3.0, obok wielu innych nowych funkcji oferuje on również wsparcie [...] [Zespół Bibliotek Cyfrowych]
Adam Dudczak z PCSS opisał swoje doświadczenia z aplikacją Tesseract wspieraną przez Google. To narzędzie może być barzdo przydatne przy organizacji linii technologicznej uwzględniającej rozpoznawanie tekstu w digitalizaowanych publikacjach.
- Tomasz Kalota - blog
- Zaloguj się, by odpowiadać
- 13745 odsłon