Teses e dissertações

Mestrado
Tecnologias Digitais para o Negócio
Título

MANCAPT: Identificação de autores e transcrição de manuscritos

Autor
Queni, Ednilson Fonseca
Resumo
pt
Este trabalho explora os desafios da digitalização de documentos manuscritos, com foco na variabilidade da caligrafia e nas limitações dos sistemas de Reconhecimento Ótico de Caracteres (OCR) genéricos. Este trabalho consiste na criação de um protótipo designado por MANCAPT, que apresenta uma solução baseada em tecnologias avançadas, incluindo o Microsoft AI Document Intelligence, utilizado para a criação de modelos personalizados de diferentes autorias e transcrição dos manuscritos, e a arquitetura neural InceptionV3, utilizada para a identificação dos autores dos manuscritos com elevada precisão. O MANCAPT integra técnicas de pré-processamento como a binarização, remoção de ruído e normalização da escala, complementadas por data augmentation para criar um conjunto de treino consistente. Foram utilizadas imagens manuscritas e impressas numa proporção equilibrada (70% impressas 30% manuscritas), permitindo ao modelo capturar tanto padrões claros como nuances estilísticas da escrita manual. Os resultados experimentais demonstraram que a integração do InceptionV3 e do Azure AI Document Intelligence no sistema aumentou a precisão da identificação de autores para 98% e reduziu a Taxa de Erro de Caracteres (CER) para 6%, em comparação com o modelo genérico do Azure AI Document Intelligence, que obteve um CER de 11,3% na transcrição de manuscritos. A abordagem personalizada do MANCAPT revelou-se crucial para lidar com as idiossincrasias da escrita, promovendo a eficiência em soluções de OCR.
en
This work explores the challenges of digitizing handwritten documents, focusing on handwriting variability and the limitations of generic Optical Character Recognition (OCR) systems. This study involves the creation of a prototype named MANCAPT, which provides a solution based on advanced technologies, including Microsoft AI Document Intelligence for the development of customized models for different authors and the transcription of manuscripts, as well as the neural architecture InceptionV3 for high-precision author identification. MANCAPT integrates preprocessing techniques such as binarization, noise removal, and scale normalization, complemented by data augmentation to create a robust and resilient training dataset. Handwritten and printed images were used in a balanced proportion (70% printed, 30% handwritten), allowing the model to capture both clear patterns and stylistic nuances of manual writing. Experimental results demonstrated that integrating InceptionV3 with Azure AI Document Intelligence improved author identification accuracy to 98% and reduced the Character Error Rate (CER) to 6%, compared to the generic Azure AI Document Intelligence model, which achieved a CER of 11.3% in manuscript transcription. The personalized approach of MANCAPT proved crucial in addressing the idiosyncrasies of handwriting, enhancing the efficiency of OCR solutions.

Data

09-jun-2025

Palavras-chave

Aprendizagem máquina
Inteligência artificial -- Artificial intelligence
Machine learning -- Machine learning
Reconhecimento ótico de caracteres
Optical character recognition
Identificação de autor
Author identification

Acesso

Acesso livre

Ver no repositório  
Voltar ao topo