dc.contributor.author |
ALMEIDA, RICARDO DE OLIVEIRA |
|
dc.date.accessioned |
2016-09-23T18:26:10Z |
|
dc.date.available |
2016-09-23T18:26:10Z |
|
dc.date.issued |
2014 |
|
dc.identifier.uri |
http://hdl.handle.net/123456789/26 |
|
dc.description.abstract |
O presente trabalho visa o desenvolvimento de uma técnica para reconhecimento automático de documentos, para sistemas de gerência eletrônica de documentos (GED). Sistemas GED atualmente, não possuem um sistema para o reconhecimento automático de documentos, o que torna o armazenamento e a recuperação de documentos muito lenta. A técnica abordada neste trabalho consiste em segmentar a imagem em blocos de informações utilizando a morfologia matemática binária. A partir destes blocos extrair a informação textual de cada um utilizando o motor OCR Tesseract. Então é possível gerar arquivos de textos, que serão úteis para o processo de indexação de documentos. Os testes foram realizados em uma base de imagens contendo 90 documentos públicos, os documentos testados foram: Portarias, Atos executivos e Ordens de Serviços. Os testes apresentaram resultados promissores, o reconhecimento dos caracteres foi bem sucedido e não houve perda de informações ao realizar o recorte nos blocos de imagens. |
pt_BR |
dc.language.iso |
pt_BR |
pt_BR |
dc.subject |
1. Gerência Eletrônica de Documentos, 2. OCR, 3. GED, 4. Morfologia Matemática. |
pt_BR |
dc.title |
RECONHECIMENTO AUTOMÁTICO DE BLOCOS PARA AUXILIAR A INDEXAÇÃO EM SOLUÇÕES GED |
pt_BR |
dc.type |
TCC |
pt_BR |